<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:media="http://search.yahoo.com/mrss/"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>InputFormat - 四号程序员</title>
	<atom:link href="https://www.coder4.com/archives/tag/inputformat/feed" rel="self" type="application/rss+xml" />
	<link>https://www.coder4.com</link>
	<description>Keep It Simple and Stupid</description>
	<lastBuildDate>Sat, 08 Nov 2014 07:58:39 +0000</lastBuildDate>
	<language>en-US</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.3</generator>
	<item>
		<title>如何拓展Hadoop的InputFormat为其他分隔符</title>
		<link>https://www.coder4.com/archives/4313</link>
					<comments>https://www.coder4.com/archives/4313#comments</comments>
		
		<dc:creator><![CDATA[coder4]]></dc:creator>
		<pubDate>Sat, 08 Nov 2014 07:58:39 +0000</pubDate>
				<category><![CDATA[大数据技术]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[InputFormat]]></category>
		<category><![CDATA[分隔符]]></category>
		<guid isPermaLink="false">http://www.coder4.com/?p=4313</guid>

					<description><![CDATA[在Hadoop中，常用的TextInputFormat是以换行符作为Record分隔符的。 在实际应用中，我们经常会出现一条Record中包含多行的情况，例如： &#60;doc&#62; .... &#60;/doc&#62; 此时，需要拓展TextInputFormat以完成这个功能。 先来看一下原始实现： public class TextInputFormat extends FileInputFormat&#60;LongWritable, Text&#62; {[......] 继续阅读]]></description>
		
					<wfw:commentRss>https://www.coder4.com/archives/4313/feed</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
		<item>
		<title>Hive中的InputFormat、OutputFormat与SerDe</title>
		<link>https://www.coder4.com/archives/4031</link>
					<comments>https://www.coder4.com/archives/4031#comments</comments>
		
		<dc:creator><![CDATA[coder4]]></dc:creator>
		<pubDate>Thu, 28 Nov 2013 03:50:45 +0000</pubDate>
				<category><![CDATA[大数据技术]]></category>
		<category><![CDATA[Hive]]></category>
		<category><![CDATA[InputFormat]]></category>
		<category><![CDATA[OutputFormat]]></category>
		<category><![CDATA[SerDe]]></category>
		<guid isPermaLink="false">http://www.coder4.com/?p=4031</guid>

					<description><![CDATA[前言 Hive中，默认使用的是TextInputFormat，一行表示一条记录。在每条记录(一行中)，默认使用^A分割各个字段。 在有些时候，我们往往面对多行，结构化的文档，并需要将其导入Hive处理，此时，就需要自定义InputFormat、OutputFormat，以及SerDe了。 首先来理清这三者之间的关系，我们直接引用Hive官方说法： SerDe is a short name for "Serializer and Deserializer." Hive us[......] 继续阅读]]></description>
		
					<wfw:commentRss>https://www.coder4.com/archives/4031/feed</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
	</channel>
</rss>
