Tag Archives: sort

MySQL中,Group By后,取每组的Top N条记录

转载自:http://www.geeklab.info/2012/11/mysql-how-to-get-top-n-rows-for-each-group/

We have the following table and data:

 

 

Session Variables

MySQL, at least on the versions I’ve checked, does no[……]

继续阅读

升级到JDK 7后,Sort出现兼容性问题的解法。

在昨天的文章 TimSort in Java 7 中,我们讨论了升级到JDK 7后,Collection的sort方法,出现兼容性问题的原因。

究其根本,还是我们写的compare函数不够严谨。

本文主要针对Hadoop、Hive,从系统的部署、配置层面提出一些解法。

1、Hive

在执行前,指定JVM选项。

2、Hadoop

修改mapred-site.xml,增加选项。
[crayon-5b[……]

继续阅读

[转载]TimSort in Java 7

转载自:TimSort in Java 7

1. 为什么写这篇文章

这篇文章的根源是在产品中发现了一个诡异的bug:只能在产品环境下重现,在我的本地开发环境无法重现,而双方的代码没有任何区别。最后用remote debug的方法找到异常所在:

Google了这个错误,是由于Java 7内置的新排序算法导致的。这才猛然想起产品的编译环境最近升级到了Java 7。

2. 结论

在Java 6中Arrays.[……]

继续阅读

Linux Shell sort命令,多域排序的正确用法。。

之前多少次都是错的。

这才是正确的,假设对列1按照字母序,2按照数值序。

2014.05.12更新:

如果数据中有科学计数法,形如”8.0177E-4″,默认是不支持它排序的,可以用-g代替-n

2015.02.25更新:

如果要制定分割符为tab键,可以如下:
[crayo[……]

继续阅读

Linux sort的四个小技巧

像排序这种事情,用C/C++可以写,但很麻烦,交给sort就好了,功能很强大的。

1、按照多个列排序(列间空格分开):

测试数据:

先按照第1列排序,再第2列的命令:

2011-11-20补充:必须加-s选项,表示stable sort,即两列排序互相不打扰。

2、sort默认是字典序比较,我们可以-n让它按照强制数字转换,以解决0199< 100的问题。
[crayon-5bc8c3f0beb[……]

继续阅读