gpt4 book ai didi

php - 识别字符串是否为驼峰式

转载 作者:行者123 更新时间:2023-12-04 14:19:03 24 4
gpt4 key购买 nike

我试图让 PHP_CodeSniffer 检查类名中的驼峰命名法,但是在我看来,驼峰命名法检查是不可能的(没有字典,包括技术词)。

我已经浏览了互联网,但到目前为止,我看到的唯一选择是字符串是否有一些共同的分隔符可以爆炸 - 即下划线、单词之间的空格等。

甚至这也没有用,因为只有在名称准确/始终在每个单词之间包含分隔符时,检查才能准确。
“检查”的重点是确定名称的格式是否不正确,这可能包括未正确分隔。

此外,关于 PHP_CodeSniffer 的资源要么很少见,要么只有作者/开发人员才能理解它的基本和技术。

当前标准嗅探检查

我在一些当前的 Sniffs(即 Squiz 和 PEAR 标准)中找到了这个代码:

if (PHP_CodeSniffer::isCamelCaps($functionName, false, true, false) === false) 

但是,我查看了 PHP_CodeSniffer 核心代码,该函数仅执行以下操作:
// Check the first character first.
// Check that the name only contains legal characters.
// Check that there are not two capital letters next to each other.
// The character is a number, so it cant be a capital.

这些基本检查总比没有好,尽管可以说对于它们假定的预期目的毫无用处,因为它们根本没有真正检查驼峰式大小写。

问题

嗅探(或即 PHP 脚本)如何知道要检查给定字符串中的哪些“单词”以识别字符串是否为 100% 驼峰式大小写?

编辑

例子

正确的驼峰式大小写: class calculateAdminLoginCount
// Not camelCase
class calculateadminlogincount

// Partially camelCase
class calculateadminLogincount

怎么会 isCamelCaps()函数(或与此相关的任何 PHP 脚本)捕获上述两个示例?

当函数或 PHP 脚本没有“单词”的概念而不提供该信息(即来自字典)时,它如何从字符串中识别“单独的单词”?

即使一个脚本在哪里爆炸,它会根据什么爆炸?

class calculateadminLogincount任何 PHP 脚本如何识别 calculate admin Login count该字符串中的不同单词是否能够检查:第一个字母第一个单词是小写的,然后所有后续单词的第一个字母都是大写的?
isCamelCaps()功能
public static function isCamelCaps(
$string,
$classFormat=false,
$public=true,
$strict=true
) {

// Check the first character first.
if ($classFormat === false) {
$legalFirstChar = '';
if ($public === false) {
$legalFirstChar = '[_]';
}

if ($strict === false) {
// Can either start with a lowercase letter,
// or multiple uppercase
// in a row, representing an acronym.
$legalFirstChar .= '([A-Z]{2,}|[a-z])';
} else {
$legalFirstChar .= '[a-z]';
}
} else {
$legalFirstChar = '[A-Z]';
}

if (preg_match("/^$legalFirstChar/", $string) === 0) {
return false;
}

// Check that the name only contains legal characters.
$legalChars = 'a-zA-Z0-9';
if (preg_match("|[^$legalChars]|", substr($string, 1)) > 0) {
return false;
}

if ($strict === true) {
// Check that there are not two capital letters
// next to each other.
$length = strlen($string);
$lastCharWasCaps = $classFormat;

for ($i = 1; $i < $length; $i++) {
$ascii = ord($string{$i});
if ($ascii >= 48 && $ascii <= 57) {
// The character is a number, so it cant be a capital.
$isCaps = false;
} else {
if (strtoupper($string{$i}) === $string{$i}) {
$isCaps = true;
} else {
$isCaps = false;
}
}

if ($isCaps === true && $lastCharWasCaps === true) {
return false;
}

$lastCharWasCaps = $isCaps;
}
}//end if

return true;

}//end isCamelCaps()

编辑 2

给那些想知道这是否值得,或者我只是“胡闹”和“玩得开心”的人的一些信息:

必须在整个过程中正确命名类名,因为文件/文件夹结构以及名称和类名必须匹配,以便自动加载器可靠地工作。

虽然我已经检查了核心代码本身以检查和处理这些问题,如果脚本、类等无法加载(当然),附加脚本(PHP_CodeSniffer)运行所有文件并告诉我潜在的问题可能是谎言。
即使只是进行第二次检查,尤其是因为它还可以确保代码库整洁、结构正确并且始终具有连续性。

最佳答案

您可以通过拆分大小写转换的单词来分析函数名称的正确大小写。对于原始函数名称的每个部分,在字典或字典+行话文件('calc'、'url'、'admin' 等(可能先检查行话)中查找该子词)。如果任何子词失败,那么正确的大写就没有到位。

您可以使用 Solr 或 ElasticSearch 使用 Lucene 中的 WordDelimiterFilter 为您分解单词。当案例发生变化时,这将创建子词:
"PowerShot" -> "Power" "Shot"
"LoginURL" => "Login" "URL"

您可以将单词直接插入这些 NoSQL 数据库并稍后进行分析,或者您可以(至少在 ES 中)简单地使用单词分隔符标记过滤器来分解您的查询,而无需实际保存结果。

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-word-delimiter-tokenfilter.html

https://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.WordDelimiterFilterFactory

例子:

calcAdminLogin => calc 管理员登录

calcadminlogin => calcadminlogin

如果您有一个包含诸如“calc”和“admin”之类的词的补充词典,那么第一个函数名称将分解为将出现在词典中的 3 个词,因此驼峰式大小写是正确的。

在第二个示例中,'calcadminlogin' 将无法在字典中找到,因此驼峰式大小写不正确。

关于php - 识别字符串是否为驼峰式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28949075/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com