- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
背景:我正在尝试增量解析“cos(1.2)”等表达式。现在,到实际问题(注意:实际问题主要在下一段中;其余的都是关于似乎几乎有效的解决方案的漫谈):
假设我有一个 Java 中的字符串,它可能以 float 开头,然后后面有一些更多的“东西”。例如,我可能有 52hi(以“52”开头,以“hi”结尾)或 -1.2e1e9(以“-1.2e1”开头,也称为“负十二”,以“e9”结尾) )。我想将这个数字解析为 double 。
使用 Double.parseDouble 很诱人,但此方法期望字符串作为一个整体是有效的数字,如果不是,则会抛出异常。显而易见的事情是编写一个正则表达式将数字与其他内容分开,然后使用 parseDouble。
如果我正在解析整数,这不会太糟糕,比如 -?[0-9]+
。 (即便如此,很容易忘记边缘情况,现在您的用户无法输入 +9 与 -9 对称。因此前面的正则表达式应该是 [-+]?[0-9]+
.) 但对于 float 来说就很复杂了;也许是这样的(忽略“.”在大多数正则表达式方言中默认不按字面意思理解的事实):
[-+]?[0-9]*.?[0-9]*(e[-+]?[0-9]+)?
。
只不过我们刚刚说过空字符串是有效数字。 “.e2”也是如此。所以可能有点复杂。或者也许我可以有一个像上面这样的“草率”正则表达式,只要它不禁止任何实际数字,它就允许一些非数字。但在某些时候,我开始对自己思考“这不是 parseDouble 的工作吗?”。它正在完成找出字符串中数字结束位置和其他内容开始位置所需的大部分工作,因为否则它将无法抛出异常。为什么我也必须这么做?
所以我开始寻找 Java 标准库中是否还有其他可以提供帮助的内容。我通常选择的工具是 java.util.Scanner,它有一个很好的 nextDouble() 方法。但 Scanner 工作于“ token ”,因此 nextDouble 的真正意思是“获取下一个 token 并尝试将其解析为 double ”。标记由分隔符分隔,我的默认分隔符是空格。因此,扫描仪在处理“52 hi”时不会有任何问题,但无法处理“52hi”。理论上,分隔符可以是我选择的任何正则表达式,因此我所要做的就是编写一个正则表达式,当它匹配时,表示数字的结尾。但这似乎比直接编写正则表达式更难。
当我发现 java.text.DecimalFormat 时,我正要放弃希望,它明确表示“我将尽我所能进行解析,并且我会告诉你我已经走了多远,以便你可以继续做其他事情从那时起”。但它似乎主要是为了格式化供人类使用的东西而设计的,并且可能解析机器编写的东西,但不是解析人类编写的东西,并且它以一堆小方式出现。例如,它“支持”像“1.2e1”这样的科学记数法,但是如果您使用它,它会坚持数字必须采用科学记数法,如果您输入“12”,它会导致解析失败。人们可以尝试通过检查失败的位置并将之前的内容解析为数字来解决此问题,但这很容易出错,甚至比只为 float 编写正则表达式更烦人。
同时,在 C 中,这只是 sscanf("%f"),而在 C++ 中,您可以使用字符串流来完成基本相同的操作。 Java 中真的没有类似的东西吗?
最佳答案
documentation for Double.valueOf(String)
实际上包含一个正则表达式,您可以使用它来检查字符串是否为 double
。
这里,没有注释:
final String Digits = "(\\p{Digit}+)";
final String HexDigits = "(\\p{XDigit}+)";
final String Exp = "[eE][+-]?"+Digits;
final String fpRegex =
("[\\x00-\\x20]*"+
"[+-]?(" +
"NaN|"+
"Infinity|" +
"((("+Digits+"(\\.)?("+Digits+"?)("+Exp+")?)|"+
"(\\.("+Digits+")("+Exp+")?)|"+
"((" +
"(0[xX]" + HexDigits + "(\\.)?)|" +
"(0[xX]" + HexDigits + "?(\\.)" + HexDigits + ")" +
")[pP][+-]?" + Digits + "))" +
"[fFdD]?))" +
"[\\x00-\\x20]*");
您可以像这样使用它:
Matcher m = Pattern.compile(fpRegex).matcher(input);
if (m.find()) {
String doublePartOnly = m.group();
}
通过一些基本测试,我发现正则表达式是贪婪的,因此它将匹配1.2e1hello
中的1.2e1
,而不是只是1.2
。
关于java - 在java中解析带有尾随垃圾的 float ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60441195/
我是 C 新手,还没有真正掌握 C 何时决定释放对象以及何时决定保留对象。 heap_t 是指向结构堆的指针。 heap_t create_heap(){ heap_t h_t = (heap
我有一个问题,我不知道如何解决。问题是: char * ary = new Char[]; ifstream fle; fle.open(1.txt, ios_base::binary); fle.s
假设我在 C# 中有字符串:“我看不到你……” 我想删除(替换为空等)这些“’”符号。 我该怎么做? 最佳答案 那个“垃圾”看起来很像有人将 UTF-8 数据解释为 ISO 8859-1 或 Wi
我无法在解析方法中更改蜘蛛设置。但这绝对是一种方式。 例如: class SomeSpider(BaseSpider): name = 'mySpider' allowed_domains
在开始之前,我们先回顾一下堆是个什么玩意,大家可能都知道,我们每天创建的Java对象几乎都存放在堆上面,所以说堆是一个巨大的对象池一点都不过分,在这个对象池里面管理者数据巨大的对象实例。 在对
我想知道为什么 printf() 在提供数组且没有格式化选项时成功打印字符数组,但在使用整数数组时编译器会抛出警告并打印垃圾值。 这是我的代码: #include int main() { c
我正在研究 Scrapy 库并尝试制作一个小爬虫。 这是爬虫的规则: rules = ( Rule(LinkExtractor(restrict_xpaths='//div[@class="w
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Printing a string to a temporary stream object in C++
这个问题在这里已经有了答案: Are WebGL objects garbage collected? (2 个答案) 关闭 3 年前。 在 WebGL 中,纹理的创建和销毁使用: WebGLTex
我继承了以下代码: (为保护无辜者更改了一些名称。) package foo.bar.baz; import javax.swing.JPanel; //Main panel in the GUI c
如果我没记错的话,在某些情况下,Java 中的 lambda 会生成为匿名类实例。例如,在这段代码中,lambda 需要从外部捕获一个变量: final int local = 123456; lis
我正在阅读托管代码中的内存泄漏,想知道是否可以在 C# 不安全代码中创建它? unsafe { while(true) new int; } 我不确定如果它作为不安全代码运行,是否会被 GC
假设我有以下用 HTML 编写的网页(仅正文部分): ... function fn() { // do stu
我想知道是否有简单的命令可以删除在 latex 编译过程中生成的所有不必要的文件,例如.aux、.log 等 最好将它链接到常规的 Latex 构建命令,这样在我点击“编译”后,垃圾文件就会被删除。
Java 在 Java7 中引入了带有字符串的 switch case。我想知道使用这样的开关盒是否会产生垃圾。 例如在我的程序中, String s = getString(); switch(s)
Cevelop将 char junk 作为“未初始化的变量”对象。在这种情况下,解决问题的正确方法是什么? friend std::ostream& operator>(std::istream&
关闭。这个问题需要debugging details .它目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and t
我正在编写一个发送和接收纯文本的小型 boost asio tcp 服务器和客户端。通信或多或少是请求响应。在测试期间,我想我只是向服务器发送垃圾数据,向它发送 100.000 个请求。 客户端发
我正在使用 SAX 来读取/解析 XML 文档,并且它工作正常,除了这个特定的站点,在该站点中 eclipse 告诉我“文档元素之后的垃圾”并且我没有返回任何数据 http://www.zachblu
这是我的 Scrapy 爬虫代码。我正在尝试从网站中提取元数据值。没有元数据在一个页面上出现多次。 class MySpider(BaseSpider): name = "courses"
我是一名优秀的程序员,十分优秀!