- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在接受 &str
的函数中并返回 impl Iterator<Item = char>
,我正在尝试将输入转换为小写,然后过滤并映射该小写形式的字符。在使用 str.to_lowercase()
时,我被以下错误卡住了一段时间。 :
--> src/lib.rs
|
| cipher
| _____^
| |_____|
| ||
| || .to_lowercase()
| ||_______________________- temporary value created here
| | .chars()
| | .filter(|c| c.is_alphanumeric() && c.is_ascii())
... |
| | }
| | })
| |___________^ returns a value referencing data owned by the current function
函数的原始形式:
pub fn decode_to_iter(cipher: &str) -> impl Iterator<Item = char> {
cipher
.to_lowercase()
.chars()
.filter(|c| c.is_alphanumeric() && c.is_ascii())
.map(|c| {
if c.is_alphabetic() {
(((b'z' - (c as u8)) + b'a') as char)
} else {
c
}
})
}
我在网上遇到了几个非常相似的问题,这些问题是关于如何返回已使用 .to_lowercase()
转换的拥有值的。但是发布的所有解决方案都不适合我。
我试图避免使用 &char
并坚持 char
在我的返回类型中。
我试过使用类似 .to_owned()
的函数获得引用文献的所有权,但却空手而归。
最终,我能够使用 char.to_ascii_lowercase()
编译并通过我的测试。 .我的函数的工作版本是:
pub fn decode_to_iter<'a>(cipher: &'a str) -> impl Iterator<Item = char> + 'a {
cipher
.chars()
.filter(|c| c.is_alphanumeric() && c.is_ascii())
.map(|c| {
if c.is_alphabetic() {
(((b'z' - (c.to_ascii_lowercase() as u8)) + b'a') as char)
} else {
c.to_ascii_lowercase()
}
})
}
最让我困惑的事情之一是 str.to_lowercase()
之间的区别是什么?和 char.to_ascii_lowercase()
是。 .to_ascii_lowercase()
的文档在 Primative Type Char 下显示:
pub fn to_ascii_lowercase(&self) -> char
虽然 .to_lowercase()
的文档在 Primative Type Str 下显示:
pub fn to_lowercase(&self) -> String
除非我误解了,否则这两个函数似乎都返回一个拥有的值,所以我不确定为什么只返回 char.to_ascii_lowercase()
有效。
我在想:
如何正确返回 Impl Iterator
使用 .to_lowercase()
的值而不是 .to_ascsii_lowercase()
?
char.to_lowercase()
之间有什么区别?和 str.to_ascii_lowercase()
?
最佳答案
这里的问题是 str::to_lowercase
分配一个新的 String
值作为字符串的小写版本,然后 str::chars
方法借用了新的 String
值。 (您可以通过查看 std::str::Chars
结构来判断它是从 String
值借用的,该结构有一个生命周期参数,该参数指的是它正在迭代其字符的字符串。)
那么为什么会出现问题呢?好吧,由 to_lowercase
分配的 String
值是作为迭代器链的一部分创建的临时值,它又在函数作用域的末尾被丢弃(编译器的错误消息应该告诉你这个)。因此,编译器会阻止您遇到释放后使用错误。如果它允许您返回迭代器,那么它将允许调用者读取已被释放的 String
,这违反了内存安全。
您使用 char::to_ascii_lowercase
的变体之所以有效,是因为您从不分配该中间 String
值。因此,您最终会返回一个从输入借用到函数的迭代器,这是有效的,也是您需要添加生命周期参数的原因。 (否则,编译器假定 impl Trait
的生命周期是 'static
,但这里不是这种情况。返回值的生命周期是 tied 到函数输入的生命周期。)
您可以通过避免分配临时 String
来解决此问题,这有望提高效率。诀窍是要意识到 char
有一个方法 char::to_lowercase
它在给定字符的小写等价物上返回一个迭代器,并且不是一个String
。因此,您可以直接从这里读取:
pub fn decode_to_iter<'a>(cipher: &'a str) -> impl Iterator<Item = char> + 'a {
cipher
.chars()
.flat_map(|c| c.to_lowercase())
.filter(|c| c.is_alphanumeric() && c.is_ascii())
.map(|c| {
if c.is_alphabetic() {
(((b'z' - (c as u8)) + b'a') as char)
} else {
c
}
})
}
这里唯一真正的技巧是使用 flat_map
,它类似于普通的 map
,但它允许您返回一个迭代器,然后将其展平为原始迭代器(如果你在这里使用普通的 map
,你最终会得到一个迭代器的迭代器)。
话虽如此,如果您真的只关心这里的 ASCII 代码点(由于您的 filter
谓词),那么您不需要完整的 Unicode 感知小写机制。所以我可能会用类似于你的第二个变体的方式来编写它,使用 char::to_ascii_lowercase
:
pub fn decode_to_iter<'a>(cipher: &'a str) -> impl Iterator<Item = char> + 'a {
cipher
.chars()
.filter(|c| c.is_ascii_alphanumeric())
.map(|c| c.to_ascii_lowercase())
.map(|c| {
if c.is_alphabetic() {
(((b'z' - (c as u8)) + b'a') as char)
} else {
c
}
})
}
这是一个 playground link显示代码。
关于rust - 为什么我可以返回一个使用 'char.to_ascii_lowercase()` 而不是 `str.to_lowercase()` 的拥有值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57174539/
这个问题在这里已经有了答案: Why don't Java's +=, -=, *=, /= compound assignment operators require casting? (11 个
当我尝试运行以下代码时,List(.of) 无法编译并给出主题错误。 package collections; import java.util.LinkedHashSet; import java.
我正在尝试编译使用 ChatScript 库的程序。这是我在名为 main.cpp 的文件中的代码: #include #include "common.h" using namespace std
我想在我的程序中外部使用 ChatScript。在documents它说: Embedding Step #1 First, you will need to modify `common.h and
假设我有一个 char,我想用一行代码将其 strcat() 转换为 char 数组。对于 [一个非实用的] 示例: strcat("ljsdflusdfg",getchar()); 或者我想做相反的
我有以下类型签名: *Main Lib> let f :: a -> a -> a -> a; f = undefined *Main Lib> let x :: Char; x = undefin
我正在学习如何在 C 中使用指针(使用 malloc 和 free),但我在这个练习中遇到了一些麻烦。我只想制作一个指针数组,我想在其中保存每个单词的方向。然后我想为一个特定的词做一个 free(),
我有一个字符*: char* version = "10.5.108"; 我想通过字符分隔符获取两个新的 char*。 char delimiter = '.'; 执行以下代码后: printf("|
最近在学习Cpp,今天在学习使用Clion做测试的时候,发生了奇怪的事情。 这是我的代码 int main() { char c = 'b'; char carr[1]{'a'};
我对 c 很陌生,我正在审查一些代码。我遇到了这个: static char * fromDataType; static char * toDataType; static char * fromR
我有一个像这样的动态结构: struct network { int count; char** ips; } 如果我知道每个字符串数组都是 16 个字节(即 INET_ADDRSTR
我有一个旧程序,其中使用了一些库函数,但我没有那个库。 所以我正在使用 C++ 库编写该程序。在那个旧代码中有一些函数是这样调用的 *string = newstrdup("这里有一些字符串"); 字
我正在编写一个函数,该函数接受 ArrayList,然后将每个 char[] 复制到另一个增加长度的 char[] 中,然后将新的 char[] 添加到新的 ArrayList 中。当我尝试复制数组时
我正在寻找 map >并生成每个可能的 map从它。 我知道这可能会占用大量内存并需要一些时间。 每个map需要包含每个字母 a-z,并映射到唯一的 a-z 字符。 IE。啊bjcp迪EVfh嘎血红蛋
#define NAME_LEN 20 #include "stdio.h" #include "stdlib.h" #include "string.h" #pragma warning(disab
所以我必须创建一个函数来找到一对带有第一个字母并返回第二个字母的函数。 我实际上找到了一个答案,但是使用 map 功能却找不到。 lookUp :: Char -> [(Char, Cha
我最近接受采访并要求写mystrcat(*s1, *s2, *s3) 其中s1 和s2 是源字符串连接结果由 s3 给出。有人告诉我,不要担心 s3 的内存分配,并假设 s1 和 s2 不是空/无效字
今天我与一位同事讨论了他(对我来说)不寻常的“main”函数签名。他喜欢这样声明: int main(int argc, char* (*argv)[]) { printf("at index
这个问题在这里已经有了答案: 关闭 12 年前。 Possible Duplicate: What's the difference between new char[10] and new cha
通常字符串文字是 const char[] 类型。但是当我把它当作其他类型时,我得到了奇怪的结果。 unsigned char *a = "\355\1\23"; 使用此编译器会抛出警告“初始化中的指
我是一名优秀的程序员,十分优秀!