- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我知道如何使用 Pig、hive、sqoop 使用 Json loader 和 Json serde 在 hadoop 中导入和分析结构化和半结构化数据,但如何导入视频、音频或图像等非结构化数据以及如何对其进行进一步分析.请逐步简单地解释,如果您有任何分析非结构化数据的用例,将会有很大帮助。谢谢!
最佳答案
由于 Hadoop 不能很好地处理小文件,一种方法是将二进制文件分组为少量大文件(以避免处理有大量的小文件)。
为此,您可以使用自定义 UDF 将二进制文件(图像、音频、视频等)转换为序列文件,将它们聚合并存储到 HDFS。
下面的书 Pig Design Patterns 提供了一些关于这个主题的设计模式(见第 2 章)。
https://www.packtpub.com/mapt/book/big_data_and_business_intelligence/9781783285556
github 上提供了一些代码片段。
https://github.com/pradeep-pasupuleti/pig-design-patterns/blob/master/Chapter2
希望对您有所帮助!
关于hadoop - 我们如何在 Hadoop 中导入视频或音频或图像,并可以做进一步的分析。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47277554/
我有这个: const {ops} = getOplogStreamInterpreter(strm); ops.del.subscribe(v => { console.log('delete
我四处搜索,据我所知,POST 表单请求已被限制为 10MB (http://golang.org/src/net/http/request.go#L721)。 如果我要在我的 ServeHTTP 方
我是一名优秀的程序员,十分优秀!