Hive中的序列化和反序列化

3.1. SerDe是什么 SerDe是Serializer、Deserializer的简称,目的是用于序列化和反序列化。序列化是对象转化为字节码的过程;而反序列化是字节码转换为对象的过程。 Hive使用SerDe(和FileFormat)读取和写入行对象。
将文件数据映射到表上 --反序列化
#百度百科解释-->序列化 (Serialization)
#是将对象的状态信息转换为可以存储或传输的形式的过程。
#在序列化期间,对象将其当前状态写入到临时或持久性存储区。.
#以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。
将表上的数据写入文件 --序列化

需要注意的是,“key”部分在读取时会被忽略,而在写入时key始终是常数。基本上行对象存储在“value”中。 可以通过desc formatted tablename查看表的相关SerDe信息。默认如下:
3.2. Hive读写文件流

Hive中的序列化和反序列化最先出现在Python成神之路

版权声明:
作者:感冒的梵高
链接:https://www.techfm.club/p/3892.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>