• 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧

HiveQL – String在hiveql UDF中包含等价物吗?

HiveQL – String在hiveql UDF中包含等价物吗?
我想用hiveql UDF来检查字符串是否包含任何特定的字符?HiveQL – String在hiveql UDF中包含等价物吗? 我遇到了下面的一个。 find_in_set(str, strlist) 这是正确的UDF使用? 例如: 下面列包含 “1” 的值。 column1 = "test1String" 我需要编写一个HiveQL……继续阅读 »

Pentaho组件集成

Pentaho组件集成
我对Pentaho很新。 我想要做的是将Hive查询提交给Hadoop集群,并通过创建关联或计算趋势来分析结果。我设法通过Pentaho数据集成提交Hive查询allready。但我不知道如何分析它。我已经看到,许多其他Pentaho组件都是Weka。如何将数据集成与Weka和可视化工具集成?有没有包含所有这些组件的东西?Pentaho组件集成 =====……继续阅读 »

得到错误而执行蜂巢合并

得到错误而执行蜂巢合并
我运行下面的查询:得到错误而执行蜂巢合并 MERGE INTO college_for_mrg AS T USING college AS S ON clg_name = clg_name WHEN MATCHED AND clg_id > 5 THEN UPDATE SET clg_loc = "ind" WHEN NOT MATCHED T……继续阅读 »

HiveHbase集成如何在Hive shell中添加Jar文件

HiveHbase集成如何在Hive shell中添加Jar文件
我正在使用CDH 5.11.1版本。如果我直接去蜂巢外壳并键入HiveHbase集成如何在Hive shell中添加Jar文件 hive> add jar /path/protobuf-java-2.4.1 我得到的查询返回: 非零代码:1,原因:路径不存在。 在Hive shell中安装所有jar文件的正确过程是什么? 如何识别与CDH版本兼……继续阅读 »

配置单元 – 从现有表创建外部表

配置单元 – 从现有表创建外部表
配置单元 – 从现有表创建外部表,如果无法完成…是否有解决方法。配置单元 – 从现有表创建外部表 我使用的蜂巢版本是:Hive 1.2.1000.2.4.2.0-258 ,我想跑的东西如下查询… create external table table_1 stored as orc location'was……继续阅读 »

WHERE子句中分区列的顺序是否重要

WHERE子句中分区列的顺序是否重要
如果我们有一个由col,col2,col3分区的HIVE表,那么在对此表执行SELECT时,如果我想在WHERE子句中指定这些列,是否必须显示按照相同的顺序来利用分区?我的意思是,逻辑上是,但HIVE编译器不理解他们的实际顺序,不管我指定他们的顺序如何。它应该能够在内部应用正确的顺序,因为HIVE已经知道正确的顺序是col2,col2,col3它以这种方式使……继续阅读 »

将mysql表复制到Java Webapp中的配置单元

将mysql表复制到Java Webapp中的配置单元
我在mysql中有一张桌子。我想在 hive 中复制它。我正在使用的编程语言是java。我必须在webapp中执行此操作。因此,我通过JDBC成功连接到两个数据库。现在的问题是如何导出-导入表? 手动加载-将MySQL表导出为csv数据并将该csv数据导入到Hive表。对于我来说,现在看起来可行。但不是理想的解决方案。 Sqoop:不能找到它的可行实现,……继续阅读 »

如何追加到Hive数组?

如何追加到Hive数组?
我有一个Hive表,其中为用户ID我有一个ts列,这是一个时间序列,存储为数组。我想把时间序列保持为最近的窗口。 (a)如何在由ID连接的另一个表中的每个列的末尾附加一个新的数字? (b)如何删除前导号码?如何追加到Hive数组? ===========解决方案如下: Hive中的数据通常存储在HDFS中。 HDFS具有有限的附加功能。如果数据的不断修改是……继续阅读 »