- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试为自然语言解析器返回的词性标签和其他标签创建可区分的联合。
在 C#/Java 中通常使用字符串或枚举来表示它们,但在 F# 中似乎更适合区分联合,因为它们是不同的只读值。
在语言引用中,我发现这个符号
可用于分隔关键字/保留字。这适用于
``...``
type ArgumentType =<br/>
| A0 // subject<br/>
| A1 // indirect object<br/>
| A2 // direct object<br/>
| A3 //<br/>
| A4 //<br/>
| A5 //<br/>
| AA //<br/>
| ``AM-ADV``
但是,标签包含 $ 等符号,例如
type PosTag =<br/>
| CC // Coordinating conjunction<br/>
| CD // Cardinal Number<br/>
| DT // Determiner<br/>
| EX // Existential there<br/>
| FW // Foreign Word<br/>
| IN // Preposision or subordinating conjunction<br/>
| JJ // Adjective<br/>
| JJR // Adjective, comparative<br/>
| JJS // Adjective, superlative<br/>
| LS // List Item Marker<br/>
| MD // Modal<br/>
| NN // Noun, singular or mass<br/>
| NNP // Proper Noun, singular<br/>
| NNPS // Proper Noun, plural<br/>
| NNS // Noun, plural<br/>
| PDT // Predeterminer<br/>
| POS // Possessive Ending<br/>
| PRP // Personal Pronoun<br/>
| PRP$ //$ Possessive Pronoun<br/>
| RB // Adverb<br/>
| RBR // Adverb, comparative<br/>
| RBS // Adverb, superlative<br/>
| RP // Particle<br/>
| SYM // Symbol<br/>
| TO // to<br/>
| UH // Interjection<br/>
| VB // Verb, base form<br/>
| VBD // Verb, past tense<br/>
| VBG // Verb, gerund or persent participle<br/>
| VBN // Verb, past participle<br/>
| VBP // Verb, non-3rd person singular present<br/>
| VBZ // Verb, 3rd person singular present<br/>
| WDT // Wh-determiner<br/>
| WP // Wh-pronoun<br/>
| WP$ //$ Possessive wh-pronoun<br/>
| WRB // Wh-adverb<br/>
| ``#``<br/>
| ``$``<br/>
| ``''``<br/>
| ``(``<br/>
| ``)``<br/>
| ``,``<br/>
| ``.``<br/>
| ``:``<br/>
| `` //not sure how to escape/delimit this
不适用于 WP$ 或类似 (
``...``
此外,我还有一个有趣的问题,即解析器将 `` 作为有意义的符号返回,因此我也需要对其进行转义。
有没有其他方法可以做到这一点,或者这对于受歧视的工会来说是不可能的吗?
现在我收到类似这样的错误
我想我可以以某种方式为这些愚蠢的情况覆盖 toString 并将符号替换为一些字母数字等价物?
最佳答案
规范似乎并不清楚在什么情况下允许在双反引号中转义哪些字符。
我认为您最好的选择是对 DU 案例使用标准标识符,并按照您的建议覆盖 ToString
。
关于f# - 如何在可区分的联合中使用符号/标点符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3057815/
我想将字符串拆分为列表中的单独句子。 例子: string = "Hey! How are you today? I am fine." 输出应该是: ["Hey!", "How are you to
好吧,这是我第一次发帖,所以如果我有任何错误,请多多包涵。长话短说,我得到了一个字符串数组,我的目标是计算字符串的唯一单词数并从数组中删除所有标点符号。 public static HashMap u
我正在尝试为自然语言解析器返回的词性标签和其他标签创建可区分的联合。 在 C#/Java 中通常使用字符串或枚举来表示它们,但在 F# 中似乎更适合区分联合,因为它们是不同的只读值。 在语言引用中,我
我正在处理 go/golang,尝试编写需要字符串和种子的代码。它应该返回一个打乱的字符串,其中单词中的第一个和最后一个字母、标点符号和数字保持不变。 示例: my name is Nikki. My
这个问题在这里已经有了答案: How can I use "." as the delimiter with String.split() in java [duplicate] (8 个答案) 关
我需要一种方法来使用包含省份缩写、全名和地区的词典,而不必为安大略省的每个可能的拼写错误添加条目。表如下: state |name | territory ============
我需要能够仅使用 C++ 字符串才能更改下面的输入段落。我遇到的问题是,当我在末尾拉出带有标点符号的东西时,例如“programs-”,它会将它作为“programs-”拉入我的数组,而不是分别将“p
我编写了一个函数来删除停用词和标记化,如下所示: def process(text, tokenizer=TweetTokenizer(), stopwords=[]): text =
df <- structure(list(`a a` = 1:3, `a b` = 2:4), .Names = c("a a", "a b" ), row.names = c(NA, -3L), c
我正在尝试使用javascript制作一个回文程序,即使字符串有标点符号和空格,它也会通过TRUE或FALSE显示字符串是否是回文(前女士,我是亚当)。但每次我输入一个字符串时,无论字符串是什么,我都
删除选择性连字符 import pandas as pd s = pd.Series(['do not-remove this-hyphen but remove-all of these-hyphe
在 Web 表单条目中,我们看到使用了奇怪的字符,例如: '(windows 1252 编码) 或 ðŸ'•(表情符号) 或 |(不知道,但认为它是 windows 1252) 对于其中一些,我可以使
从字符串中过滤掉所有 UTF-8 标点字符和符号(如✀✁✂✃✄✅✆✇✈等)的最佳和最有效方法是什么。简单地过滤掉所有不在 a-z、A-Z 和 0-9 中的字符不是一种选择,因为我想保留来自其他语言的字
Ruby 中是否有识别 Unicode 标点符号(例如,",-)的正则表达式? 最佳答案 你可以使用这个: /[[:punct:]]/ 有关更多信息,请查看 Regexp class .您也可以在此
我正在尝试创建一个 LPeg 模式,该模式将匹配 UTF-8 编码输入中的任何 Unicode 标点符号。我想出了以下 Selene Unicode 和 LPeg 的结合: local unicode
我正在编写一个Python代码来从输入文件中提取所有URL,其中包含来自Twitter(推文)的内容或文本。然而,在这样做时,我意识到在 python 列表中提取的几个 URL 在末尾有“特殊字符”或
我写emacs lisp代码如下: #!/usr/bin/emacs --script (setq input (read-minibuffer "please input your name:")
这是我的代码。用户将提供输入(任何字符串)而不是“这是一个测试。1 2 3 4 5”。 然后它将显示空格数、标点符号、数字和字母作为输出字符串。 #include #include using n
我正在尝试比较没有任何标点符号、空格、重音符号等的名称。目前我正在做以下事情: -(NSString*) prepareString:(NSString*)a { //remove any a
我正在使用 Ruby on Rails 3.1.0,我想知道如何在 YAML 文件中正确声明冒号(标点符号)。我试图通过在我的 config/locales/defaults/en.yml 文件 中添
我是一名优秀的程序员,十分优秀!