- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 java 上完成了这段代码,它收集有关照片的各种信息并将结果提取到文本文件中。我想将此程序转换为使用 MapReduce 模型运行。我是 MapReduce 编程的新手。任何帮助将不胜感激!谢谢
import java.io.*;
import java.util.*;
import java.net.*;
import javax.xml.parsers.ParserConfigurationException;
import org.xml.sax.SAXException;
import com.aetrion.flickr.people.User;
import com.aetrion.flickr.photos.Photo;
import com.aetrion.flickr.photos.PhotoList;
import com.aetrion.flickr.photos.PhotosInterface;
import com.aetrion.flickr.photos.SearchParameters;
import com.aetrion.flickr.photosets.PhotosetsInterface;
import com.aetrion.flickr.test.TestInterface;
import com.aetrion.flickr.people.PeopleInterface;
import com.aetrion.flickr.groups.*;
import com.aetrion.flickr.groups.pools.*;
import com.aetrion.flickr.*;
public class example2{
public example2() {
}
/**
* @param args
* @throws FlickrException
* @throws SAXException
* @throws IOException
* @throws ParserConfigurationException
*/
@SuppressWarnings("deprecation")
public static void main(String[] args) throws IOException, SAXException, FlickrException, ParserConfigurationException { // TODO Auto-generated method stub
FileWriter out = new FileWriter("photos.txt");
//Set api key
String key="apikey";
String svr="www.flickr.com";
REST rest=new REST();
rest.setHost(svr);
//initialize Flickr object with key and rest
Flickr flickr=new Flickr(key,rest);
Flickr.debugStream=false;
//initialize SearchParameter object, this object stores the search keyword
SearchParameters searchParams=new SearchParameters();
searchParams.setSort(SearchParameters.INTERESTINGNESS_DESC);
searchParams.setGroupId("group_id");
//Initialize PhotosInterface object
PhotosInterface photosInterface=flickr.getPhotosInterface();
//Execute search with entered tags
PhotoList photoList=photosInterface.search(searchParams,500,1);
if(photoList!=null){
//Get search result and check the size of photo result
for(int i=0;i<photoList.size();i++){
//get photo object
Photo photo=(Photo)photoList.get(i);
System.out.print(photo.getId()+"\t");
out.write(photo.getId()+"\t");
System.out.print(photo.getOwner().getId()+"\t");
out.write(photo.getOwner().getId()+"\t");
Photo photo1=photosInterface.getPhoto(photo.getId());
if(photo1.getGeoData() != null ){
System.out.print("latitute="+photo1.getGeoData().getLatitude()+"\t");
out.write(photo1.getGeoData().getLatitude()+"\t");
System.out.print("longitude="+photo1.getGeoData().getLongitude()+"\t");
out.write(photo1.getGeoData().getLongitude()+"\t");
}
else {System.out.print(photo1.getGeoData()+"\t");
out.write(photo1.getGeoData()+"\t\t"+photo1.getGeoData());}
System.out.println("");
out.write("\n");
}
out.close();
}
}}
最佳答案
我不确定这是 Hadoop 的一个很好的用例,除非您有 吨 的搜索结果要处理,并且处理占整个程序的很大一部分。搜索本身不能并行执行:只能在 for 循环中进行处理。
如果你想在 Hadoop 中并行处理一个搜索,你首先必须在 Hadoop 之外执行搜索**并将结果输出到一个文本文件——一个 ID 列表,对于实例。然后,编写一个映射器,获取一个 ID,获取照片,并执行您当前在 for 循环中执行的处理,发出带有您获取的属性的字符串(您当前正在将其打印到 System.out
). Hadoop 将为结果列表中的每个 ID 单独运行此映射器。
我不认为这是值得的,除非您计划进行一些其他处理。要考虑的一些替代方案:
使用 map-reduce 并行执行大量不同的搜索。您的程序基本上没有变化——它只是在 map 函数内运行,而不是在 main() 循环内运行。或者您的搜索可能发生在映射器中,发出结果,而您的处理可能发生在缩减器中。您的输入将是搜索词列表。
忘记 map-reduce,只使用线程池并行运行处理。查看 java.util.concurrent
中的各种 Executors
。
** 另一种让整个事情在 Hadoop“内部”运行的 hackish 方法是在 map 函数内部运行搜索,一个一个地发出结果。使用具有一行文本的输入文件——一个虚拟值——这样你的映射器只运行一次。然后在 reducer 而不是 mapper 中获取图像。
更新:
如果您有一堆不同的组 ID 需要搜索,那么您可以使用第一种“替代”方法。
按照您的建议,使用组 ID 和 API key 作为输入。每行放一个,用制表符或您可以轻松解析的内容分隔。如果您希望它们在不同的映射器中运行,您还必须将它们分成不同的文件。如果您只有与节点一样多的组 ID,您可能只想在每个文件中放一行。将 TextInputFormat
用于您的 Hadoop 作业。带有组 ID 和 API key 的行将是 值——使用 value.toString().split("\t")
将其分成两部分.
然后,在映射器中运行整个搜索。对于每个结果,使用 context.write(key, value)
(或 output.collect(key, value)
,取决于你的版本)写一个照片 ID 作为键和以您的属性作为值的字符串。这两个都必须转换为 Hadoop 的 Text
对象。
我不会为此提供批发代码——只需调整 Hadoop 应该很容易 MapReduce tutorial .唯一真正的区别:
使用 job.setOutputValueClass(Text)
,并更改 IntWritable
在映射器类签名:
public static class Map
extends Mapper<LongWritable, Text, Text, Text> {
只需禁用 reducer 。取出 reducer 类,然后更改:
job.setMapperClass(Map.class);
job.setCombinerClass(Reduce.class);
job.setReducerClass(Reduce.class);
进入这个:
job.setMapperClass(Map.class);
job.setNumReduceTasks(0);
如果您对如何让它发挥作用有任何具体问题,请随时提出。不过,请务必先投入一些研究工作。
关于java - MapReduce编程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6034203/
我正在尝试打印 timeval 类型的值。实际上我可以打印它,但我收到以下警告: 该行有多个标记 格式“%ld”需要“long int”类型,但参数 2 的类型为“struct timeval” 程序
我正在编写自己的 unix 终端,但在执行命令时遇到问题: 首先,我获取用户输入并将其存储到缓冲区中,然后我将单词分开并将它们存储到我的 argv[] 数组中。IE命令是“firefox”以启动存储在
我是 CUDA 的新手。我有一个关于一个简单程序的问题,希望有人能注意到我的错误。 __global__ void ADD(float* A, float* B, float* C) { con
我有一个关于 C 语言 CGI 编程的一般性问题。 我使用嵌入式 Web 服务器来处理 Web 界面。为此,我在服务器中存储了一个 HTML 文件。在此 HTML 文件中包含 JavaScript 和
**摘要:**在代码的世界中,是存在很多艺术般的写法,这可能也是部分程序员追求编程这项事业的内在动力。 本文分享自华为云社区《【云驻共创】用4种代码中的艺术试图唤回你对编程的兴趣》,作者: break
我有一个函数,它的任务是在父对象中创建一个变量。我想要的是让函数在调用它的级别创建变量。 createVariable testFunc() [1] "test" > testFunc2() [1]
以下代码用于将多个连续的空格替换为1个空格。虽然我设法做到了,但我对花括号的使用感到困惑。 这个实际上运行良好: #include #include int main() { int ch, la
我正在尝试将文件写入磁盘,然后自动重新编译。不幸的是,某事似乎不起作用,我收到一条我还不明白的错误消息(我是 C 初学者 :-)。如果我手动编译生成的 hello.c,一切正常吗?! #include
如何将指针值传递给结构数组; 例如,在 txt 上我有这个: John Doe;xxxx@hotmail.com;214425532; 我的代码: typedef struct Person{
我尝试编写一些代码来检索 objectID,结果是 2B-06-01-04-01-82-31-01-03-01-01 . 这个值不正确吗? // Send a SysObjectId SNMP req
您好,提前感谢您的帮助, (请注意评论部分以获得更多见解:即,以下示例中的成本列已添加到此问题中;西蒙提供了一个很好的答案,但成本列本身并未出现在他的数据响应中,尽管他提供的功能与成本列一起使用) 我
我想知道是否有人能够提出一些解决非线性优化问题的软件包的方法,而非线性优化问题可以为优化解决方案提供整数变量?问题是使具有相等约束的函数最小化,该函数受某些上下边界约束的约束。 我已经在R中使用了'n
我是 R 编程的初学者,正在尝试向具有 50 列的矩阵添加一个额外的列。这个新列将是该行中前 10 个值的平均值。 randomMatrix <- generateMatrix(1,5000,100,
我在《K&R II C 编程 ANSI C》一书中读到,“>>”和“0; nwords--) sum += *buf++; sum = (sum >>
当下拉列表的选择发生变化时,我想: 1) 通过 div 在整个网站上显示一些 GUI 阻止覆盖 2)然后处理一些代码 3) 然后隐藏叠加层。 问题是,当我在事件监听器函数中编写此逻辑时,将执行 onC
我正在使用 Clojure 和 RESTEasy 设计 JAX-RS REST 服务器. 据我了解,用 Lisp 系列语言编写的应用程序比用“传统”命令式语言编写的应用程序更多地构建为“特定于领域的语
我目前正在研究一种替代出勤监控系统作为一项举措。目前,我设计的用户表单如下所示: Time Stamp Userform 它的工作原理如下: 员工将选择他/她将使用的时间戳类型:开始时间、超时、第一次
我是一名学生,试图自学编程,从在线资源和像您这样的人那里获得帮助。我在网上找到了一个练习来创建一个小程序来执行此操作: 编写一个程序,读取数字 a 和 b(长整型)并列出 a 和 b 之间有多少个数字
我正在尝试编写一个 shell 程序,给定一个参数,打印程序的名称和参数中的每个奇数词(即,不是偶数词)。但是,我没有得到预期的结果。在跟踪我的程序时,我注意到,尽管奇数词(例如,第 5 个词,5 %
只是想知道是否有任何 Java API 可以让您控制台式机/笔记本电脑外壳上的 LED? 或者,如果不可能,是否有可能? 最佳答案 如果你说的是前面的 LED 指示电源状态和 HDD 繁忙状态,恐怕没
我是一名优秀的程序员,十分优秀!