data-cleaning使用Hive清理大数据 我正在使用Hive查询我拥有的数据。问题是,这些数据需要清理,而且对于我来说,在计算机上尝试处理它的方法太大(因此使用Hadoop和Hive)。我有办法用Hive做到这一点吗?我研究了用户定义的函数,但我的理解是它们会逐行操作,因此可能不是清理数据的最佳方法。 谢谢 解决方案如下: 您应该使用MapReduce程序清理数据。甚至不要使用 reduce……继续阅读 »