- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 azure-ai-textanalytics(版本 5.2.7)库来检测我拥有的某些文本内容中的 PII。根据 Azure 文档,使用异步处理时允许的最大字符数为 125,000 个字符。 https://learn.microsoft.com/en-us/azure/cognitive-services/language-service/concepts/data-limits
使用下面的 azure 库是我构建异步客户端的方式:
private static TextAnalyticsAsyncClient createTextClient() {
if (textAnalyticsClient == null) {
textAnalyticsClient = new TextAnalyticsClientBuilder()
.credential(new AzureKeyCredential(AzureKeyVaultConnector.readKeyValue("languageResourceKey")))
.endpoint(AzureKeyVaultConnector.readKeyValue("languageResourceEndPoint"))
.buildAsyncClient();
}
return textAnalyticsClient;
}
我使用以下行提交要处理的文档:
RecognizePiiEntitiesResultCollection piiEntityCollection = createTextClient().recognizePiiEntitiesBatch(documents,"en",requestOptions).block();
当我使用大约 7000 个字符的字符串进行测试时,出现以下错误:
A document within the request was too large to be processed. Limit document size to: 5120 text elements. For additional details on the data limitations see https://aka.ms/text-analytics-data-limits
为什么它仍然试图将我的最大字符大小限制为 5120?因为我使用的是异步客户端,所以不应该是 125,000 吗?如有任何帮助,我们将不胜感激。
我很想使用 azure-ai-textanalytics 库并实现这一点,而不是直接进行 http 调用(不使用 azure 库)。
最佳答案
根据您给出的场景,我使用 this 重现了代码和输出documentation. 中提供了示例异步请求代码
您遇到的问题是因为 125,000 个字符的限制是针对异步请求中所有提交的文档的字符总数,而不是针对单个文档。异步处理中单个文档允许的最大字符数仍然是5,120 个字符。
对于 PII 检测,您可以请求的限制为 5 个文档,如 documentation由您分享。因此,对于 PII 检测,每个请求的字符总数限制为:25600
例如,如果您的请求包含 2 个文档(5120 个字符)和 3 个文档 ()输出将产生 2 个文档的结果(长度低于限制)。
输出:https://i.imgur.com/OUmrwvk.png
所有 5 个文档必须低于 5120 个字符限制才能获得完整结果。
要处理较大的文档(大于 5120 个字符),您可以将其分解为较小的文本 block ,然后再将其发送到 API。下面是一个示例代码片段,用于创建具有单个较大文档/文本的文档列表:
在 Python 中,
def split_string(string):
#Splits a string into multiple strings, each of which is no more than 5120 characters long.
strings = []
for i in range(0, len(string), 5120):
strings.append(string[i:min(len(string), i + 5120)])
return strings
在 Java 中,
// Split the string into multiple strings, each of which is no more than 5120 characters long.
List<String> strings = new List<String>();
for (int i = 0; i < originalString.length(); i += 5120) {
strings.add(originalString.substring(i, Math.min(originalString.length(), i + 5120))); }
关于Azure 认知服务 : Async Text analytics for PII, 将允许的最大字符大小限制为 5120,而本应为 125,000,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/76424525/
最近,我收到了一个项目要求,即从某个页面将数据发送到Google Analytics(分析)。我不知道该怎么做。 帐户ID和所有内容均已创建,我只想知道如何在加载某个网页时发送数据。 我一直在根据自己
我试图在此站点和其他一些站点上找到此问题的答案。但这似乎并不适合我自己。以下网址显示了有关如何同时使用GA和UA的说明。 How to use both ga.js and analytics.js?
从谷歌的文档: The analytics.js snippet is part of Universal Analytics, which is currently in public beta.
根据google的新analytics.js文档,您可以设置多个跟踪器,并通过在单独的send调用中按名称明确提及跟踪器来向其发送事件: https://developers.google.com/a
有什么办法可以让 Google Analytics 的“In-Page Analytics”显示外部链接流量? 实际上,外部链接的综合浏览量会显示在流量报告中,但不会显示在页内分析中。 我们正在使用这
我正在尝试编写一个 Google Analytics API 查询,它只返回去年每个月的每月唯一身份访问者。 This is the data I see in the Google Analytic
我们在我们的应用程序中使用 Google Analytics,但现在我们需要更改它并改用 Adobe Analytics。 在对这两种工具进行比较研究时,我现在意识到了这两种工具的优缺点和特点,
我需要您有关 Google Analytics (analytics.js) 的帮助。我在头部有第一个通用部分,效果很好: (function(i,s,o,g,r,a,m
这个问题在这里已经有了答案: Why use protocol-relative URLs at all? (5 个答案) 关闭 5 年前。 我正在阅读 https://developers.goo
将目标从Analytics(分析)导入到AdWords中,然后在Analytics(分析)中更改目标条件时,是否可以通过更改将目标“重新导入”到AdWords,还是可以自动选择? 最佳答案 更改目标值
Google最近更新了他们对开发人员的政策。 https://play.google.com/about/privacy-security/personal-sensitive/ If your ap
我正在使用google analytics api来获取数据。我正在获取数据,但我想验证两个参数,它们在特定日期范围内始终为0。我正在获取['ga:transactions']和['ga:goalCo
我使用Google API从Google Analytics(分析)获取数据,但指标与Google Analytics(分析)的网络界面不同。 即:我在2015年3月1日获得数据-它返回综合浏览量79
我安装了 Google Analytics (UA) 并将跟踪代码添加到 html 页面。我从浏览器文件中运行 html 页面:///C:/test.html 并使用谷歌调试器进行调试,它成功运行并显
我正在遵循 https://developers.google.com/analytics/devguides/collection/amp-analytics/ 的简单指南 尝试添加 Pagevie
我计划管理大约。通过为每个属性创建带有主机名过滤器的专用 View ,可以在一个属性下创建 400 个差异站点。是否有任何流程可以在不手动创建 View 和制作过滤器的情况下完成此任务? 例如:我们有
我想使用 Google Analytics API 访问 User Explorer 数据,以获取 JSON 值形式的报告。使用此 JSON 值,我可以创建用于分析的 Web 应用程序仪表板。我在此
我正在尝试使用此代码来跟踪 Google Analytics 中的事件 _trackEvent(category, action, opt_label, opt_value, opt_noni
我目前正在使用访问 token 和刷新 token 从 Google Analytics Reporting API (v4) 中提取数据。当我致力于自动从 Google Analytics 中提取数
我正在尝试根据此相关问题实现 anchor (index.html#anchor)跟踪: How to track anchor tags with Google Analytics 我使用 anch
我是一名优秀的程序员,十分优秀!