Tag Archives: transform

Hive中的TRANSFORM:使用脚本完成Map/Reduce。

数据、例子,修改自:《Hive with Python example》

首先来看一下数据:
hive> select * from test;
OK
1 3
2 2
3 1
假设,我们要输出每一列的md5值。在目前的hive中是没有这个udf的。

我们看一下Python的代码:
#!/home/tops/bin/python

import sys
import hashlib

for line in sys.st[......]

继续阅读