当前位置: 代码迷 >> 综合 >> Difference between orc and parquet format
  详细解决方案

Difference between orc and parquet format

热度:4   发布时间:2023-12-09 22:41:48.0

参考:

https://www.cnblogs.com/ITtangtang/p/7677912.html

https://blog.csdn.net/yu616568/article/details/51868447

https://hortonworks.com/blog/orcfile-in-hdp-2-better-compression-better-performance/

 

总结

两者都是参考了Google 的Dremel 的数据格式, 列存储, 有预存统计信息

区别是Parquet 对于 nested data (嵌套类型, 复杂类型 比如struct)有更好的支持

其他方面ORC性能好点

Cloudera推Parquet, Hortonworks推ORC

  相关解决方案