前端之家收集整理的这篇文章主要介绍了
PostgreSQL学习篇13.1 统计信息的收集,
前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
PgStat子进程是Postgresql中专门的统计信息收集器进程。表和索引的行数、块数等统计信息记录在系统表pg_class中,其他的统计信息主要收集在系统表pg_statistic中。
统计信息收集器的配置项:
#------------------------------------------------------------------------------
# RUNTIME STATISTICS
#------------------------------------------------------------------------------
# - Query/Index Statistics Collector -
#track_activities = on --是否允许跟踪每个session正在执行的sql命令的信息和命令开始的时间。可在pg_stat_activity中看到。
#track_counts = on --控制是否收集表和索引上访问的统计信息。
#track_io_timing = off --是否允许统计IO调用时间。开启后可在pg_stat_database和pg_stat_statements中看到。9.2之后的新加参数
#track_functions = none # none,pl,all --是否收集函数调用次数和时间的统计信息。
#track_activity_query_size = 1024 # (change requires restart) --在pg_stat_activity中query字段最多显示多少字节。
#stats_temp_directory = 'pg_stat_tmp'
sql执行的统计信息输出:
# - Statistics Monitoring -
#log_parser_stats = off
#log_planner_stats = off
#log_executor_stats = off
#log_statement_stats = off
手工收集统计信息:
手工收集统计信息的命令是analyze命令,此命令收集表的统计信息,然后将结果保存在系统表pg_statistic中。
autovacuum守护进程,能自动地分析表,并收集表的统计信息。
analyze的命令格式:
analyze [verbose] [table[(column[,..])]]
verbose:显示处理的进度,以及表的一些统计信息。
table:要分析的表名,如果不指定,则对整个数据库中的所有表作分析。
column:要分析的特定字段的名字默认是分析所有字段。
analyze命令会在表上加读锁。
对于大表,analyze只读取表的部分内容做一个随机抽样,不读取表的所有内容。统计信息只是近似的结果。为了调整所收集的统计信息的准确度,可以增大随机抽样比例,可通过参数default_statistics_target来实现,这个参数可以在session级别设置,可以在列级别设置。
set default_statistics_target to xxx;
alter table tab_name alter column col_name set statistics xxx;
analyze有一个统计项是估计出现在每列的不同值的数目。但因为仅仅抽样部分行,所以这个统计项的估计值有时候会很不准确,为了避免因这个错误导致差的查询计划,可以手工指定这个列有多少个唯一值:alter table tab_name alter column col_name set (n_distinct=xxx;
如果表是有继承关系的其他字表的父表,还可以设置n_distinct_inherited,这样子表会继续使用这个父表的设置值。