HBase伪集群配置

Leave a reply

与Hadoop一样，HBase也有三种运行模式：Standalone, Distributed, Pseudo-distributed。

其中，Pseudo-distributed称为伪集群模式，与Distributed基本一样，只不过进程都运行在一台机器上。

1、对HDFS配置伪集群模式。

见：Hadoop伪集群测试与 Hadoop集群配置详细版

2、配置HBase

hbase-site.xml
<?xml version="1.0"[......]

继续阅读

Perl中切割字符串限定分为几组

Leave a reply

在Perl中，切割字符串很简单。
my ($k, $v) = split(/\t/, $string);
但如果数据中含有不止一个分隔符\t呢，比如这样：
a\tb\tc
此时，需要给spilit第三个参数，一个正整数，表示至多分为多少组。比如我们想只使用第1个分隔符，切分为2部分，则输入2。
my($first, $rest) = split(/\t/, $string, 2);
[......]

继续阅读

Perl中如何让Hash的值为数组

Leave a reply

这涉及到Perl的scalar和Array语境问题。

有问题的代码：
$new_hash{$some_key1} = @some_array1;

foreach($newhash{$some_key1}) {
print $_
}
打印的结果是只输出了一个元素，其值为数组的长度。

这里的问题是，赋值给Hash的Value是数组的长度，需要强制使用数组语境@{$hash{$key}}：
@{$new_hash{$some_key1}} = @some_array[......]

继续阅读

[转]Perl使用Getopt获取命令行参数

1 Reply

代码示例如下：
use Getopt::Std;
my %opt;
getopts('d:f:p', \%opt);
if($opt{p}){
...
}
if($opt{d}){
$dFile=$opt{d};
}
解释一下"d:f:p"，d和f后有冒号，表示-d，-f后面要跟参数。p后面没有冒号，表示-p后面不带参数。

而且-d，-f后所跟的参数分别赋给变量$opt_d和$opt_f。对于变量$opt_p，若命[......]

继续阅读

[转]vim打开中文(gbk)乱码

Leave a reply

转自：http://www.cnblogs.com/hopeworld/archive/2011/04/20/2022331.html
Vim有四个跟字符编码方式有关的选项，encoding、fileencoding、fileencodings、termencoding(这些选项设置请参考Vim文档中encoding-names章节)，它们的意义如下:

encoding
encoding是Vim内部使用的字符编码方式，包括Vim的buffer(缓冲区)、菜单文本、消息文本等。默认[......]

继续阅读

四号程序员

Keep It Simple and Stupid

HBase伪集群配置

Perl中切割字符串限定分为几组

Perl中如何让Hash的值为数组

[转]Perl使用Getopt获取命令行参数

[转]vim打开中文(gbk)乱码