<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>question Re: HBase stores base64 data when data is inserted from Hive table through SerDe, Why? in Support Questions</title>
    <link>https://community.cloudera.com/t5/Support-Questions/HBase-stores-base64-data-when-data-is-inserted-from-Hive/m-p/388460#M246678</link>
    <description>&lt;P&gt;&lt;a href="https://community.cloudera.com/t5/user/viewprofilepage/user-id/110271"&gt;@Marks_08&lt;/a&gt;&amp;nbsp;The encoding is being performed by HBase SerDe&lt;SPAN&gt;, for the binary data. Could you change the col data type to STRING&lt;/SPAN&gt;&amp;nbsp;if your data does not really require binary storage?&lt;/P&gt;</description>
    <pubDate>Tue, 28 May 2024 18:06:24 GMT</pubDate>
    <dc:creator>smruti</dc:creator>
    <dc:date>2024-05-28T18:06:24Z</dc:date>
    <item>
      <title>HBase stores base64 data when data is inserted from Hive table through SerDe, Why?</title>
      <link>https://community.cloudera.com/t5/Support-Questions/HBase-stores-base64-data-when-data-is-inserted-from-Hive/m-p/388458#M246676</link>
      <description>&lt;P&gt;Hello there!&lt;/P&gt;&lt;P&gt;We create a hive external table that refers to a HBase table:&lt;/P&gt;&lt;P&gt;CREATE EXTERNAL TABLE&amp;nbsp; &lt;STRONG&gt;default.c_COUNTRIES_AP&lt;/STRONG&gt;&lt;/P&gt;&lt;P&gt;(&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; key&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; BINARY,&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; CF1_COUNTRY_ID_1&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; BINARY,&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; CF1_COUNTRY_NAME_2&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; BINARY,&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; CF1_COUNTRY_REGION_3&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; BINARY,&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; CF1_COUNTRY_SUBREGION_4&amp;nbsp;&amp;nbsp;&amp;nbsp; BINARY )&lt;/P&gt;&lt;P&gt;STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'&lt;BR /&gt;WITH SERDEPROPERTIES (&lt;BR /&gt;"hbase.columns.mapping" = ":key,CF1:COUNTRY_ID#s,CF1:COUNTRY_NAME#s,CF1:COUNTRY_REGION#s,CF1:COUNTRY_SUBREGION#s"&lt;BR /&gt;)&lt;BR /&gt;TBLPROPERTIES ("&lt;STRONG&gt;hbase.table.name" = "COUNTRIES_TGT&lt;/STRONG&gt;")&lt;/P&gt;&lt;P&gt;In Hive, we insert some data into the hive external table:&lt;BR /&gt;insert into c_countries_ap values ('ZA', 'ZA', 'South Africa', 'Africa', 'Africa');&lt;/P&gt;&lt;P&gt;select * from c_countries_ap shows correct data is inserted&lt;/P&gt;&lt;P&gt;&lt;STRONG&gt;But when we go to HBase shell, and do a SCAN ‘COUNTRIES_TGT’, it shows:&lt;/STRONG&gt;&lt;/P&gt;&lt;P&gt;hbase:063:0&amp;gt; scan 'COUNTRIES_TGT'&lt;BR /&gt;ROW&amp;nbsp; &amp;nbsp; COLUMN+CELL&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/P&gt;&lt;P&gt;WkE= column=CF1:COUNTRY_ID, timestamp=1716416439777, value=WkE=&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;BR /&gt;WkE= column=CF1:COUNTRY_NAME, timestamp=1716416439777, value=U291dGggQWZyaWNh&amp;nbsp;&lt;BR /&gt;WkE= column=CF1:COUNTRY_REGION, timestamp=1716416439777, value=QWZyaWNh&amp;nbsp;&amp;nbsp;&lt;BR /&gt;WkE= column=CF1:COUNTRY_SUBREGION, timestamp=1716416439777, value=QWZyaWNh&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&lt;STRONG&gt;The data in HBase is all base64 encoded.&lt;/STRONG&gt;&lt;/P&gt;&lt;P&gt;If we do SQOOP import into HBase table, the data in HBase table is not encoded.&lt;/P&gt;&lt;P&gt;This only happens when data is inserted from Hive table through SerDe.&lt;/P&gt;&lt;P&gt;We are wondering if there are any configuration parameters need to changed?&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;</description>
      <pubDate>Tue, 28 May 2024 16:45:34 GMT</pubDate>
      <guid>https://community.cloudera.com/t5/Support-Questions/HBase-stores-base64-data-when-data-is-inserted-from-Hive/m-p/388458#M246676</guid>
      <dc:creator>Marks_08</dc:creator>
      <dc:date>2024-05-28T16:45:34Z</dc:date>
    </item>
    <item>
      <title>Re: HBase stores base64 data when data is inserted from Hive table through SerDe, Why?</title>
      <link>https://community.cloudera.com/t5/Support-Questions/HBase-stores-base64-data-when-data-is-inserted-from-Hive/m-p/388460#M246678</link>
      <description>&lt;P&gt;&lt;a href="https://community.cloudera.com/t5/user/viewprofilepage/user-id/110271"&gt;@Marks_08&lt;/a&gt;&amp;nbsp;The encoding is being performed by HBase SerDe&lt;SPAN&gt;, for the binary data. Could you change the col data type to STRING&lt;/SPAN&gt;&amp;nbsp;if your data does not really require binary storage?&lt;/P&gt;</description>
      <pubDate>Tue, 28 May 2024 18:06:24 GMT</pubDate>
      <guid>https://community.cloudera.com/t5/Support-Questions/HBase-stores-base64-data-when-data-is-inserted-from-Hive/m-p/388460#M246678</guid>
      <dc:creator>smruti</dc:creator>
      <dc:date>2024-05-28T18:06:24Z</dc:date>
    </item>
    <item>
      <title>Re: HBase stores base64 data when data is inserted from Hive table through SerDe, Why?</title>
      <link>https://community.cloudera.com/t5/Support-Questions/HBase-stores-base64-data-when-data-is-inserted-from-Hive/m-p/388461#M246679</link>
      <description>&lt;P&gt;Thanks&amp;nbsp;&lt;a href="https://community.cloudera.com/t5/user/viewprofilepage/user-id/82698"&gt;@smruti&lt;/a&gt;&amp;nbsp;&lt;BR /&gt;I changed data type to String and data is stored without encoding as I want.&amp;nbsp;&lt;BR /&gt;&lt;BR /&gt;Is there any documentation where I can find "Why t&lt;SPAN&gt;he encoding is being performed by HBase SerDe&lt;/SPAN&gt;&lt;SPAN&gt;, for the binary data"?&lt;BR /&gt;&lt;BR /&gt;regards,&lt;BR /&gt;Marks&lt;/SPAN&gt;&lt;/P&gt;</description>
      <pubDate>Tue, 28 May 2024 19:55:44 GMT</pubDate>
      <guid>https://community.cloudera.com/t5/Support-Questions/HBase-stores-base64-data-when-data-is-inserted-from-Hive/m-p/388461#M246679</guid>
      <dc:creator>Marks_08</dc:creator>
      <dc:date>2024-05-28T19:55:44Z</dc:date>
    </item>
  </channel>
</rss>

