Hive中的序列化和反序列化
3.1. SerDe是什么 SerDe是Serializer、Deserializer的简称,目的是用于序列化和反序列化。序列化是对象转化为字节码的过程;而反序列化是字节码转换为对象的过程。 Hive使用SerDe(和FileFormat)读取和写入行对象。
将文件数据映射到表上 --反序列化
#百度百科解释-->序列化 (Serialization)
#是将对象的状态信息转换为可以存储或传输的形式的过程。
#在序列化期间,对象将其当前状态写入到临时或持久性存储区。.
#以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。
将表上的数据写入文件 --序列化
需要注意的是,“key”部分在读取时会被忽略,而在写入时key始终是常数。基本上行对象存储在“value”中。 可以通过desc formatted tablename查看表的相关SerDe信息。默认如下:
3.2. Hive读写文件流
Hive中的序列化和反序列化最先出现在Python成神之路。
共有 0 条评论