<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:media="http://search.yahoo.com/mrss/"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>k最大 - 四号程序员</title>
	<atom:link href="https://www.coder4.com/archives/tag/k%E6%9C%80%E5%A4%A7/feed" rel="self" type="application/rss+xml" />
	<link>https://www.coder4.com</link>
	<description>Keep It Simple and Stupid</description>
	<lastBuildDate>Tue, 14 Feb 2012 07:50:50 +0000</lastBuildDate>
	<language>en-US</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.3</generator>
	<item>
		<title>大量数据取k个最大值并排序</title>
		<link>https://www.coder4.com/archives/2920</link>
					<comments>https://www.coder4.com/archives/2920#comments</comments>
		
		<dc:creator><![CDATA[coder4]]></dc:creator>
		<pubDate>Tue, 14 Feb 2012 07:47:45 +0000</pubDate>
				<category><![CDATA[C && C++]]></category>
		<category><![CDATA[算法&数据结构]]></category>
		<category><![CDATA[k最大]]></category>
		<category><![CDATA[算法]]></category>
		<category><![CDATA[面试]]></category>
		<guid isPermaLink="false">http://www.coder4.com/?p=2920</guid>

					<description><![CDATA[需求是这样的，我们都知道，在信息检索中，经常要取top-k(一共k，而不是第k)个得分最大的文档，并且从大到小排序。 而且文档规模很大，最少也要上千万。 话说这是一道很可以拿来面试的题啊。 我们不考虑Hadoop神马的，就说说单机怎么搞。 最傻的做法就是把1000万个都存储下来，然后sort，然后取min(k, vec.size())。 这样有两个缺点： 1、内存占用非常大，其实我们只要保留最大的1000个，但这样就要保存N个。在1000万的测试中，它要占用68M[......] 继续阅读]]></description>
		
					<wfw:commentRss>https://www.coder4.com/archives/2920/feed</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
	</channel>
</rss>
