<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:media="http://search.yahoo.com/mrss/"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>MapReduce - 四号程序员</title>
	<atom:link href="https://www.coder4.com/archives/tag/mapreduce/feed" rel="self" type="application/rss+xml" />
	<link>https://www.coder4.com</link>
	<description>Keep It Simple and Stupid</description>
	<lastBuildDate>Thu, 22 May 2025 22:57:57 +0000</lastBuildDate>
	<language>en-US</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.3</generator>
	<item>
		<title>[转]Hadoop MapReduce 二次排序原理及其应用</title>
		<link>https://www.coder4.com/archives/4248</link>
					<comments>https://www.coder4.com/archives/4248#respond</comments>
		
		<dc:creator><![CDATA[coder4]]></dc:creator>
		<pubDate>Fri, 16 May 2014 06:16:38 +0000</pubDate>
				<category><![CDATA[大数据技术]]></category>
		<category><![CDATA[MapReduce]]></category>
		<category><![CDATA[setGroupingComparatorClass]]></category>
		<category><![CDATA[setOutputkeyComparatorClass]]></category>
		<category><![CDATA[setOutputValueGroupingComparator]]></category>
		<category><![CDATA[setSortComparatorClass]]></category>
		<category><![CDATA[二次排序]]></category>
		<guid isPermaLink="false">http://www.coder4.com/?p=4248</guid>

					<description><![CDATA[转载自：《Hadoop MapReduce 二次排序原理及应用》 关于二次排序主要涉及到这么几个东西： 在0.20.0以前使用的是 setPartitionerClass setOutputkeyComparatorClass setOutputValueGroupingComparator 在0.20.0以后使用是 job.setPartitionerClass(Partitioner p); job.setSortComparatorClass([......] 继续阅读]]></description>
		
					<wfw:commentRss>https://www.coder4.com/archives/4248/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>[转载]MapReduce的模式、算法和用例</title>
		<link>https://www.coder4.com/archives/3862</link>
					<comments>https://www.coder4.com/archives/3862#respond</comments>
		
		<dc:creator><![CDATA[coder4]]></dc:creator>
		<pubDate>Wed, 03 Apr 2013 10:17:34 +0000</pubDate>
				<category><![CDATA[大数据技术]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[MapReduce]]></category>
		<category><![CDATA[模式]]></category>
		<guid isPermaLink="false">http://www.coder4.com/?p=3862</guid>

					<description><![CDATA[转载自：http://yangguan.org/mapreduce-patterns-algorithms-and-use-cases/ 翻译自：http://highlyscalable.wordpress.com/2012/02/01/mapreduce-patterns/ 在这篇文章里总结了几种网上或者论文中常见的MapReduce模式和算法，并系统化的解释了这些技术的不同之处。所有描述性的文字和代码都使用了标准hadoop的MapReduce模型，包括Mappers, Red[......] 继续阅读]]></description>
		
					<wfw:commentRss>https://www.coder4.com/archives/3862/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>WordCount的一个变种版本...Hadoop</title>
		<link>https://www.coder4.com/archives/2797</link>
					<comments>https://www.coder4.com/archives/2797#respond</comments>
		
		<dc:creator><![CDATA[coder4]]></dc:creator>
		<pubDate>Fri, 20 Jan 2012 14:15:02 +0000</pubDate>
				<category><![CDATA[大数据技术]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[MapReduce]]></category>
		<category><![CDATA[例子]]></category>
		<category><![CDATA[计算]]></category>
		<guid isPermaLink="false">http://www.coder4.com/?p=2797</guid>

					<description><![CDATA[本来是要用Hadoop给柯西搜索写一下锚文本聚集。但是发现上个版本的爬虫居然没有存锚文本，实在无聊，写了个统计域名（实际是host）的计数器。 输入：一行一个url 流程：提取url的domain，对domain计数+1 输出：域名，域名计数 这次完全用新的API写的。 代码如下： Mapper package com.keseek.hadoop; import java.io.IOException; import java.net.URI; imp[......] 继续阅读]]></description>
		
					<wfw:commentRss>https://www.coder4.com/archives/2797/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>[转载]PageRank in MapReduce</title>
		<link>https://www.coder4.com/archives/2053</link>
					<comments>https://www.coder4.com/archives/2053#respond</comments>
		
		<dc:creator><![CDATA[coder4]]></dc:creator>
		<pubDate>Fri, 12 Aug 2011 14:38:25 +0000</pubDate>
				<category><![CDATA[大数据技术]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[MapReduce]]></category>
		<guid isPermaLink="false">http://www.coder4.com/?p=2053</guid>

					<description><![CDATA[转载自一个台湾朋友写的PageRank in MapReduce 其实我一直没想到PR怎么算是因为...不知道怎么多次迭代，原来是用反复RunJob来实现的。 前言 有一陣子沒有寫MapReduce程式了，所以找個代表性的實例來練習一下... PageRank in MapReduce PageRank演算法最早是由Google兩位創辦人Sergey Brin &#38; Larry Page在1998年的時候發表在World-Wide Web Conference[......] 继续阅读]]></description>
		
					<wfw:commentRss>https://www.coder4.com/archives/2053/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
