gpt4 book ai didi

Facebook 开放图谱 API : weird behavior of parameter limit while getting a paginated user's news feed

转载 作者:行者123 更新时间:2023-11-30 05:17:44 27 4
gpt4 key购买 nike

我用 JAVA 编写了一个小脚本,它在查询 时用四个不同的值(10、100、1000 和 10000)测试参数 limit>用户的 Facebook 新闻提要 使用 Open Graph APIRestFB client .正如您将看到的,它有一个奇怪的行为...

场景:

public static void main(String[] args) {

// vars
DateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
FacebookClient client = new DefaultFacebookClient(accessToken);
Connection<Post> home;
List<Post> postList;
Map<String, Post> postMap;
int i;

// limits to test
String[] limits = {"10", "100", "1000", "10000"};
for (String limit : limits) {

// init list and map (looking for duplicate posts)
postList = new LinkedList<Post>();
postMap = new LinkedHashMap<String, Post>();
// get news feed
home = client.fetchConnection(id + "/home", Post.class, Parameter.with("limit", limit));

// going through pages
i = 1;
for (List<Post> page : home) {
for (Post post : page) {
// store into list
postList.add(post);
// store into map (unique post id)
postMap.put(post.getId(), post);
}
i++;
}

// sort posts by created time
Collections.sort(postList, new Comparator<Post>() {
@Override
public int compare(Post post1, Post post2) {
return post1.getCreatedTime().compareTo(post2.getCreatedTime());
}
});

// log
try {
FileWriter out = new FileWriter("log/output.txt", true);
out.write("LIMIT: " + limit + "\n");
out.write("\tPAGES: " + (i - 1) + "\n");
out.write("\tLIST SIZE: " + postList.size() + "\n");
out.write("\tMAP SIZE: " + postMap.size() + "\n");
out.write("\tOLDER POST: " + dateFormat.format(postList.get(0).getCreatedTime()) + "\n");
out.write("\tYOUGNER POST: " + dateFormat.format(postList.get(postList.size() - 1).getCreatedTime()) + "\n");
out.close();
} catch (IOException e) {
throw new RuntimeException(e);
}

}

}

输出:

LIMIT: 10
PAGES: 7
LIST SIZE: 56
MAP SIZE: 56
OLDER POST: 2009-03-22 14:58:03
YOUGNER POST: 2012-05-11 15:48:49
LIMIT: 100
PAGES: 3
LIST SIZE: 174
MAP SIZE: 172
OLDER POST: 2012-01-12 23:01:34
YOUGNER POST: 2012-05-11 15:48:49
LIMIT: 1000
PAGES: 2
LIST SIZE: 294
MAP SIZE: 292
OLDER POST: 2009-03-22 14:58:03
YOUGNER POST: 2012-05-11 15:48:49
LIMIT: 10000
PAGES: 2
LIST SIZE: 294
MAP SIZE: 292
OLDER POST: 2009-03-22 14:58:03
YOUGNER POST: 2012-05-11 15:48:49

解释和问题:

  1. 显然,您无法获取用户自帐户创建以来在其动态消息中发布的所有帖子。 limit有限制吗?

  2. limit 为 100、1000 和 10000,我必须在整个返回的新闻提要中每次都有两个重复的帖子 (174 - 172 = 194 - 192)。为什么?我从未在我的个人动态消息中看到同一篇帖子两次...

  3. limit 为(且仅)为 100,我得到的旧帖子是在 2012 年创建的,同时 limit 的其他值使检索 2009 年创建的帖子的查询。我可以理解,使用上限 limit(1000 或 10000),查询检索较旧的帖子。但是,为什么 limit 为 10 会使查询检索到比限制为 100 的查询更早的帖子

  4. 最后但并非最不重要的一点:我没有收到相同数量的帖子。显然,limit 越高,检索到的帖子数就越多。我首先想到的是,较小的 limit 的唯一结果是页面数量增加(尽管如此),但检索到的帖子数量不会改变。但确实如此。为什么?也就是说,帖子数似乎收敛于 limit 100 和 1000 之间,因为帖子数与 limit 1000 和 limit 相同 共 10000 个。

PS:为查询指定一个 since 和/或一个 until 参数不会改变任何东西。

欢迎任何回答/评论:)

干杯。

编辑:

这是我最好的recall :

LIMIT: 200
PAGES: 3
LIST SIZE: 391
MAP SIZE: 389
OLDER POST: 2012-01-27 14:17:16
YOUGNER POST: 2012-05-11 16:52:38

为什么是 200?是否在 documentation 中的任何位置指定?

最佳答案

它不在文档中,但我个人已经为我的项目测试了以下内容。

Facebook limit 限制为 500 个帖子。无论您将限制设置为高于 500,它最多只能获取 500 个结果。尝试使用 500 个(或更多),您将获得最多的帖子。

您不会每次都获得 500 个帖子,但通常会获得 490 个以上的帖子。一些帖子因各种原因(如隐私、被屏蔽的用户、不适合特定区域和其他原因)而被过滤

这回答了您的第一个和第四个问题。

对于问题号。 2,我不在java中工作,所以我不能说你的代码/逻辑中是否有问题或者你的代码在做什么。

对于问题号。 3、天佑facebook!

编辑

对于第 4 个问题,您可能会达到图形 API 的查询/小时限制(Facebook 使用它来防止垃圾邮件,您不能快速连续地频繁查询 API)

此外,

Facebook filter

这就是为什么您没有得到 facebook 返回的所有结果的原因。

(if you specified a limit of “5” but the five posts returned are not visible to the viewer, you will get an empty result set.)

In addition to the limits mentioned in the documentation for each of the tables and connections listed above, it is helpful to know that the maximum number of results we will fetch before running the visibility checks is 5,000.

引用:Paging with graph api and fql

此外,对于特定表格的结果数量也有限制。您可以在各自的 fql 表中获得有关它们的详细信息。

对于流表(用于帖子/提要的表),

Each query of the stream table is limited to the previous 30 days or 50 posts, whichever is greater, however you can use time-specific fields such as created_time along with FQL operators (such as < or >) to retrieve a much greater range of posts.

引用:Fql stream table

也看这里: Facebook FQL stream limit?

关于Facebook 开放图谱 API : weird behavior of parameter limit while getting a paginated user's news feed,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10553510/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com