<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>question Impala show table stats - total of rows doesn't sum up in Support Questions</title>
    <link>https://community.cloudera.com/t5/Support-Questions/Impala-show-table-stats-total-of-rows-doesn-t-sum-up/m-p/300385#M220190</link>
    <description>&lt;P&gt;Hi,&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;I'm using the Impala function "show table stats":&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;LI-CODE lang="markup"&gt;show table stats table1;&lt;/LI-CODE&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;BR /&gt;I get following results&lt;/P&gt;&lt;TABLE width="613"&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD width="97"&gt;business_date&lt;/TD&gt;&lt;TD width="132"&gt;tec_execution_date&lt;/TD&gt;&lt;TD width="64"&gt;#Rows&lt;/TD&gt;&lt;TD width="64"&gt;#Files&lt;/TD&gt;&lt;TD width="64"&gt;Size&lt;/TD&gt;&lt;TD width="64"&gt;Bytes Cached&lt;/TD&gt;&lt;TD width="64"&gt;Cache Replication&lt;/TD&gt;&lt;TD width="64"&gt;Format&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;13/05/2020&lt;/TD&gt;&lt;TD&gt;13/05/2020 20:08&lt;/TD&gt;&lt;TD&gt;0&lt;/TD&gt;&lt;TD&gt;0&lt;/TD&gt;&lt;TD&gt;0B&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;14/07/2020&lt;/TD&gt;&lt;TD&gt;15/07/2020 16:39&lt;/TD&gt;&lt;TD&gt;6&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;16.08KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;15/07/2020&lt;/TD&gt;&lt;TD&gt;16/07/2020 16:07&lt;/TD&gt;&lt;TD&gt;770&lt;/TD&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;114.68KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;16/07/2020&lt;/TD&gt;&lt;TD&gt;20/07/2020 16:50&lt;/TD&gt;&lt;TD&gt;272&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;41.88KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;17/07/2020&lt;/TD&gt;&lt;TD&gt;21/07/2020 12:38&lt;/TD&gt;&lt;TD&gt;290&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;45.33KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;20/07/2020&lt;/TD&gt;&lt;TD&gt;20/07/2020 12:16&lt;/TD&gt;&lt;TD&gt;379&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;51.10KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;21/07/2020&lt;/TD&gt;&lt;TD&gt;22/07/2020 12:45&lt;/TD&gt;&lt;TD&gt;156&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;31.50KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;24/07/2020&lt;/TD&gt;&lt;TD&gt;24/07/2020 15:15&lt;/TD&gt;&lt;TD&gt;278&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;40.26KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;Total&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;&lt;STRONG&gt;2431&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD&gt;8&lt;/TD&gt;&lt;TD&gt;340.84KB&lt;/TD&gt;&lt;TD&gt;0B&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&lt;BR /&gt;However if I sum up the rows in column "#Rows" I get &lt;STRONG&gt;2151&lt;/STRONG&gt;...!&lt;/P&gt;&lt;P&gt;Am I'm missing something? How is that possible?&lt;BR /&gt;&lt;BR /&gt;Thanks&lt;BR /&gt;&lt;BR /&gt;&lt;/P&gt;&lt;P&gt;&lt;BR /&gt;Thanks&lt;/P&gt;</description>
    <pubDate>Fri, 24 Jul 2020 15:22:57 GMT</pubDate>
    <dc:creator>ratax</dc:creator>
    <dc:date>2020-07-24T15:22:57Z</dc:date>
    <item>
      <title>Impala show table stats - total of rows doesn't sum up</title>
      <link>https://community.cloudera.com/t5/Support-Questions/Impala-show-table-stats-total-of-rows-doesn-t-sum-up/m-p/300385#M220190</link>
      <description>&lt;P&gt;Hi,&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;I'm using the Impala function "show table stats":&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;LI-CODE lang="markup"&gt;show table stats table1;&lt;/LI-CODE&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;BR /&gt;I get following results&lt;/P&gt;&lt;TABLE width="613"&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD width="97"&gt;business_date&lt;/TD&gt;&lt;TD width="132"&gt;tec_execution_date&lt;/TD&gt;&lt;TD width="64"&gt;#Rows&lt;/TD&gt;&lt;TD width="64"&gt;#Files&lt;/TD&gt;&lt;TD width="64"&gt;Size&lt;/TD&gt;&lt;TD width="64"&gt;Bytes Cached&lt;/TD&gt;&lt;TD width="64"&gt;Cache Replication&lt;/TD&gt;&lt;TD width="64"&gt;Format&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;13/05/2020&lt;/TD&gt;&lt;TD&gt;13/05/2020 20:08&lt;/TD&gt;&lt;TD&gt;0&lt;/TD&gt;&lt;TD&gt;0&lt;/TD&gt;&lt;TD&gt;0B&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;14/07/2020&lt;/TD&gt;&lt;TD&gt;15/07/2020 16:39&lt;/TD&gt;&lt;TD&gt;6&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;16.08KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;15/07/2020&lt;/TD&gt;&lt;TD&gt;16/07/2020 16:07&lt;/TD&gt;&lt;TD&gt;770&lt;/TD&gt;&lt;TD&gt;2&lt;/TD&gt;&lt;TD&gt;114.68KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;16/07/2020&lt;/TD&gt;&lt;TD&gt;20/07/2020 16:50&lt;/TD&gt;&lt;TD&gt;272&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;41.88KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;17/07/2020&lt;/TD&gt;&lt;TD&gt;21/07/2020 12:38&lt;/TD&gt;&lt;TD&gt;290&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;45.33KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;20/07/2020&lt;/TD&gt;&lt;TD&gt;20/07/2020 12:16&lt;/TD&gt;&lt;TD&gt;379&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;51.10KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;21/07/2020&lt;/TD&gt;&lt;TD&gt;22/07/2020 12:45&lt;/TD&gt;&lt;TD&gt;156&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;31.50KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;24/07/2020&lt;/TD&gt;&lt;TD&gt;24/07/2020 15:15&lt;/TD&gt;&lt;TD&gt;278&lt;/TD&gt;&lt;TD&gt;1&lt;/TD&gt;&lt;TD&gt;40.26KB&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;NOT CACHED&lt;/TD&gt;&lt;TD&gt;PARQUET&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD&gt;Total&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;&lt;STRONG&gt;2431&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD&gt;8&lt;/TD&gt;&lt;TD&gt;340.84KB&lt;/TD&gt;&lt;TD&gt;0B&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;TD&gt;&amp;nbsp;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt;&lt;P&gt;&lt;BR /&gt;However if I sum up the rows in column "#Rows" I get &lt;STRONG&gt;2151&lt;/STRONG&gt;...!&lt;/P&gt;&lt;P&gt;Am I'm missing something? How is that possible?&lt;BR /&gt;&lt;BR /&gt;Thanks&lt;BR /&gt;&lt;BR /&gt;&lt;/P&gt;&lt;P&gt;&lt;BR /&gt;Thanks&lt;/P&gt;</description>
      <pubDate>Fri, 24 Jul 2020 15:22:57 GMT</pubDate>
      <guid>https://community.cloudera.com/t5/Support-Questions/Impala-show-table-stats-total-of-rows-doesn-t-sum-up/m-p/300385#M220190</guid>
      <dc:creator>ratax</dc:creator>
      <dc:date>2020-07-24T15:22:57Z</dc:date>
    </item>
    <item>
      <title>Re: Impala show table stats - total of rows doesn't sum up</title>
      <link>https://community.cloudera.com/t5/Support-Questions/Impala-show-table-stats-total-of-rows-doesn-t-sum-up/m-p/300396#M220199</link>
      <description>&lt;P&gt;The row counts reflect the status of the partition or table the last time its stats were updated by "compute stats" in Impala (or analyze in Hive). Or that the stats were updated manually via an alter table. (There are also other cases where stats are updated, e.g. they can be automatically gathered by hive, but those are a few examples).&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;One scenario where this could happen is if a partition was dropped since the last compute stats was run.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;The stats generally can be out of sync with the # of rows in the underlying table - we don't use them for answering queries, just for query optimization, so it's fine if they're a little inaccurate.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;If you want to know the accurate counts, you can run queries like&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp; select count(*) from table;&lt;BR /&gt;&amp;nbsp; select count(*) from table where business_date = "13/05/2020" and tec_execution_date = "13/05/2020 20:08;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;</description>
      <pubDate>Fri, 24 Jul 2020 20:22:47 GMT</pubDate>
      <guid>https://community.cloudera.com/t5/Support-Questions/Impala-show-table-stats-total-of-rows-doesn-t-sum-up/m-p/300396#M220199</guid>
      <dc:creator>Tim Armstrong</dc:creator>
      <dc:date>2020-07-24T20:22:47Z</dc:date>
    </item>
  </channel>
</rss>

