? 最新版本的 Eclipse 3.5 搭配 Ubuntu 9.04 + hadoop-eclipse-plugin 0.20.1 ,初步測試功能皆可正常運作 但 Ubuntu 9.10 的 各版本 Eclipse , 似乎會有 gtk 圖形介面的bug ,有此一說增加 GDK_NATIVE_WINDOWS=1 就可以解決問題,但經過初步測試似乎無用 安裝的部份沒必要都一模一樣,僅提供參考,反正只要安裝好java , hadoop , eclipse,並清楚自己的路徑就可以了 首先安裝java 基本套件 ? 1 將javadoc (jdk-6u10-docs.zip) 下載下來?下載點 2 下載完後將檔案放在 /tmp/ 下 3 執行 ? 執行ssh localhost 沒有出現詢問密碼的訊息則無誤 安裝hadoop0.20到/opt/並取目錄名為hadoop ? ? ? ? ? 一開始會出現問你要將工作目錄放在哪裡:在這我們用預設值 PS: 之後的說明則是在eclipse 上的介面操作 設定要用 Map/Reduce 的視野 使用 Map/Reduce 的視野後的介面呈現 建立mapreduce專案(1) 建立mapreduce專案的(2) 由於剛剛建立了icas這個專案,因此eclipse已經建立了新的專案,出現在左邊視窗,右鍵點選該資料夾,並選properties Step1. 右鍵點選project的properties做細部設定 Step2. 進入專案的細部設定頁 hadoop的javadoc的設定(1) ? Step3. hadoop的javadoc的設定完後(2) Step4. java本身的javadoc的設定(3) ? 設定完後回到eclipse 主視窗 Step1. 視窗右下角黃色大象圖示"Map/Reduce Locations tag" -> 點選齒輪右邊的藍色大象圖示: Step2. 進行eclipse 與 hadoop 間的設定(2) 設定完後,可以看到下方多了一隻藍色大象,左方展開資料夾也可以秀出在hdfs內的檔案結構 ? ? ? 建立mapper.java後,貼入程式碼 ? 建立WordCount.java,此檔用來驅動mapper 與 reducer,因此選擇 Map/Reduce Driver 三個檔完成後並存檔後,整個程式建立完成 ? ? 有一熱心的hadoop使用者提供一個能讓 run-on-hadoop 這個功能恢復的方法。 原因是hadoop 的 eclipse-plugin 也許是用eclipse europa 這個版本開發的,而eclipse 的各版本 3.2 , 3.3, 3.4 間也都有或多或少的差異性存在。 因此如果先用eclipse europa 來建立一個新專案,之後把europa的eclipse這個版本關掉,換用eclipse 3.4開啟,之後這個專案就能用run-on-mapreduce 這個功能囉! 有興趣的話可以試試!(感謝逢甲資工所謝同學) ? ? ? ?零. 前言??
單位 作者 Mail 國家高速網路中心-格網技術組 Wei-Yu Chen waue @ nchc.org.tw 0.0 Info Update??
0.1 環境說明??
0.2 目錄說明??
一、安裝??
1.1. 安裝java??
$ sudo apt-get install java-common sun-java6-bin sun-java6-jdk sun-java6-jre
1.1.1. 安裝sun-java6-doc??
$ sudo apt-get install sun-java6-doc
1.2. ssh 安裝設定??
$ apt-get install ssh $ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys $ ssh localhost
1.3. 安裝hadoop??
$ cd ~ $ wget http://apache.ntu.edu.tw/hadoop/core/hadoop-0.20.0/hadoop-0.20.0.tar.gz $ tar zxvf hadoop-0.20.0.tar.gz $ sudo mv hadoop-0.20.0 /opt/ $ sudo chown -R waue:waue /opt/hadoop-0.20.0 $ sudo ln -sf /opt/hadoop-0.20.0 /opt/hadoop
export?JAVA_HOME=/usr/lib/jvm/java-6-sun?export?HADOOP_HOME=/opt/hadoop?exportPATH=$PATH:/opt/hadoop/bin
<configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/tmp/hadoop/hadoop-${user.name}</value> </property> </configuration>
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
<configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> </configuration>
$ cd /opt/hadoop $ source /opt/hadoop/conf/hadoop-env.sh $ hadoop namenode -format $ start-all.sh $ hadoop fs -put conf input $ hadoop fs -ls
1.4. 安裝eclipse??
$ cd ~ $ wget http://ftp.cs.pu.edu.tw/pub/eclipse/eclipse/downloads/drops/R-3.4.2-200902111700/eclipse-SDK-3.4.2-linux-gtk.tar.gz
$ cd ~ $ tar -zxvf eclipse-SDK-3.4.2-linux-gtk.tar.gz $ sudo mv eclipse /opt $ sudo ln -sf /opt/eclipse/eclipse /usr/local/bin/
二、 建立專案??
2.1 安裝hadoop 的 eclipse plugin??
$ cd /opt/hadoop $ sudo cp /opt/hadoop/contrib/eclipse-plugin/hadoop-0.20.0-eclipse-plugin.jar /opt/eclipse/plugins
$ sudo vim /opt/eclipse/eclipse.ini
-startup plugins/org.eclipse.equinox.launcher_1.0.101.R34x_v20081125.jar --launcher.library plugins/org.eclipse.equinox.launcher.gtk.linux.x86_1.0.101.R34x_v20080805 -showsplash org.eclipse.platform --launcher.XXMaxPermSize 512m -vmargs -Xms40m -Xmx512m
2.2 開啟eclipse??
$ eclipse &
2.3 選擇視野??
window -> open pers.. -> other.. -> map/reduce 2.4 建立專案??
file -> new -> project -> Map/Reduce -> Map/Reduce Project -> next project name-> 輸入 : icas?(隨意)?use default hadoop -> Configur Hadoop install... -> 輸入:"/opt/hadoop"?-> ok Finish
2.5 設定專案??
source?...-> 輸入:/opt/opt/hadoop-0.20.0/src javadoc ...-> 輸入:file:/opt/hadoop/docs/api/
2.6 連接hadoop server??
Location Name -> 輸入:hadoop?(隨意)?Map/Reduce Master -> Host-> 輸入:localhost Map/Reduce Master -> Port-> 輸入:9001 DFS Master -> Host-> 輸入:9000 Finish
三、 撰寫範例程式??
3.1 mapper.java??
File -> new -> mapper source?folder-> 輸入: icas/src Package : Sample Name -> : mapper
package?Sample;?import?java.io.IOException;?import?java.util.StringTokenizer;?importorg.apache.hadoop.io.IntWritable;?import?org.apache.hadoop.io.Text;?importorg.apache.hadoop.mapreduce.Mapper;?public?class?mapper?extends?Mapper<Object,?Text,?Text,IntWritable>?{?private?final?static?IntWritable one?=?new?IntWritable(1);?private?Text word?=?newText();?public?void?map(Object key,?Text value,?Context context)?throws?IOException,InterruptedException?{?StringTokenizer itr?=?new?StringTokenizer(value.toString());?while(itr.hasMoreTokens())?{?word.set(itr.nextToken());?context.write(word,?one);?}?}?}
3.2 reducer.java??
source?folder-> 輸入: icas/src Package : Sample Name -> : reducer
package?Sample;?import?java.io.IOException;?import?org.apache.hadoop.io.IntWritable;?importorg.apache.hadoop.io.Text;?import?org.apache.hadoop.mapreduce.Reducer;?public?class?reducerextends?Reducer<Text,?IntWritable,?Text,?IntWritable>?{?private?IntWritable result?=?newIntWritable();?public?void?reduce(Text key,?Iterable<IntWritable>?values,?Context context)?throwsIOException,?InterruptedException?{?int?sum?=?0;?for?(IntWritable val?:?values)?{?sum?+=val.get();?}?result.set(sum);?context.write(key,?result);?}?}
3.3?WordCount.java (main function)??
source?folder-> 輸入: icas/src Package : Sample Name -> : WordCount.java
package?Sample;?import?org.apache.hadoop.conf.Configuration;?import?org.apache.hadoop.fs.Path;import?org.apache.hadoop.io.IntWritable;?import?org.apache.hadoop.io.Text;?importorg.apache.hadoop.mapreduce.Job;?import?org.apache.hadoop.mapreduce.lib.input.FileInputFormat;import?org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;?importorg.apache.hadoop.util.GenericOptionsParser;?public?class?WordCount?{?public?static?voidmain(String[]?args)?throws?Exception?{?Configuration conf?=?new?Configuration();?String[]otherArgs?=?new?GenericOptionsParser(conf,?args)?.getRemainingArgs();?if?(otherArgs.length?!=?2)?{System.err.println("Usage: wordcount <in> <out>");?System.exit(2);?}?Job job?=?new?Job(conf,?"word count");?job.setJarByClass(WordCount.class);?job.setMapperClass(mapper.class);job.setCombinerClass(reducer.class);?job.setReducerClass(reducer.class);job.setOutputKeyClass(Text.class);?job.setOutputValueClass(IntWritable.class);FileInputFormat.addInputPath(job,?new?Path(otherArgs[0]));?FileOutputFormat.setOutputPath(job,?newPath(otherArgs[1]));?System.exit(job.waitForCompletion(true)???0?:?1);?}?}
$ cd workspace/icas $ ls src/Sample/ mapper.java reducer.java WordCount.java $ ls bin/Sample/ mapper.class reducer.class WordCount.class
四、測試範例程式??
4.1 解除run-on-hadoop封印??
4.2 運用終端指令??
4.2.1 產生Makefile 檔??
$ cd /home/waue/workspace/icas/ $ gedit Makefile
JarFile="sample-0.1.jar"?MainFunc="Sample.WordCount"?LocalOutDir="/tmp/output"?all:help jar: jar -cvf?${JarFile}?-C bin/ . run: hadoop jar?${JarFile}?${MainFunc}?input output clean: hadoop fs -rmr output output: rm -rf?${LocalOutDir}?hadoop fs -get output?${LocalOutDir}?gedit${LocalOutDir}/part-r-00000 &?help: @echo?"Usage:"?@echo?" make jar - Build Jar File."?@echo?" make clean - Clean up Output directory on HDFS."?@echo?" make run - Run your MapReduce code on Hadoop."?@echo?" make output - Download and show output file"?@echo?" make help - Show Makefile options."?@echo?" "?@echo?"Example:"?@echo?" make jar; make run; make output; make clean"
4.2.2 執行??
$ cd /home/waue/workspace/icas/ $ make Usage: make jar - Build Jar File. make clean - Clean up Output directory on HDFS. make run - Run your MapReduce code on Hadoop. make output - Download and show output file make help - Show Makefile options. Example: make jar; make run; make output; make clean
make jar??
$ make jar
make run??
$ make run
make output??
$ make output
make clean??
$ make clean
五、結論??
<ul style=
详细解决方案
wordcount在eclipse下的伪分布式运行过程
热度:100 发布时间:2016-04-23 01:50:24.0
hadoop 0.20 程式開發
http://trac.nchc.org.tw/cloud/wiki/waue/2009/0617 相关解决方案
- eclipse struts2找不到action!调了一个晚下了
- Eclipse + Tomcat Debug時很慢,该怎么解决
- eclipse+tomcat6.0+oracle 10g配置数据库连接池的异常
- eclipse ee版本 怎么新建和发布 web project
- eclipse 运用URL连接出错,求解
- eclipse jee tomcat警告有关问题
- eclipse 提醒 configure build path
- !hadoop 0.21.0 eclipse 3.7 win7,点击run on hadoop报错
- JDBC MYSQL 驱动加载失败 JSP DAO ECLIPSE,该怎么解决
- Eclipse 报错org.apache.catalina.LifecycleException: Failed to start component。该怎么解决
- eclipse 老崩溃 错误异常如下
- Eclipse JSP调用Servlet的有关问题
- eclipse 怎么发布 Dynamic web project到Tomcat
- eclipse 经典版,最新稳定版是多少?解决方法
- 【文件分享】Eclipse Plug-in资料分享
- eclipse 在线安装 birt,该怎么解决
- 现下公司里开发用的 Eclipse + MyEclipse + Tomcat + JDK 都是什么版本的
- Eclipse plugin/RCP开发资料大整理
- 现时公司里开发用的 Eclipse + MyEclipse + Tomcat + JDK 都是什么版本的
- j2me eclipse antenna打包混合出错了,该怎么处理
- Eclipse + wtk下,如何加com.nokia.mid.ui
- Eclipse 混淆包错误有关问题
- Eclipse 调试 J2ME 出现有关问题了。
- eclipse 3.2中J2ME 开发配置有关问题
- eclipse wtk 2.2整和有关问题
- eclipse 集成 javaAPI 的有关问题
- eclipse class not found 愁死了解决方法
- eclipse 没法打包资源文件
- 急问:S60,eclipse,打开模拟器总是提示“unhandled exception.Close application?该如何解决
- 请教怎么在 Eclipse 中配置M3G 包以 支持 J2ME 的 3D 游戏开发?