sql - 关联 varchar 值-6ren

sql - 关联 varchar 值

转载作者：行者123 更新时间：2023-12-04 15:03:31

27

4

Oracle 11 中是否有内置方法来检查 varchar2 字段中值的相关性？例如，给定一个简单的表，如下所示:

MEAL_NUM  INGREDIENT
--------------------
1         BEEF
1         CHEESE
1         PASTA
2         CHEESE
2         PASTA
2         FISH
3         CHEESE
3         CHICKEN

我想得到一个基于 MEAL_NUM 的数字指示，CHEESE 主要与 PASTA 搭配，而与 BEEF、CHICKEN 和 FISH 搭配的程度降低。

我的第一个倾向是使用 CORR 函数并将字符串转换为数字，方法可能是预先枚举它们或从唯一的选择中获取 rownum。

任何建议如何解决这个问题？

最佳答案

你不会想使用 CORR -- 如果您创建“食物编号”并指定牛肉 = 1、鸡肉 = 2 和意大利面 = 3，那么相关系数将告诉您奶酪的增加是否与“食物编号”的增加相关。但是“食物数量”的高或低并不意味着什么，因为你是编造出来的。所以，不要使用 CORR除非您的食物实际上是以某种方式订购的，例如数字。

统计学家谈论这个的方式是 levels of measurement .在链接文章的语言中，MEAL_NUM是一个名义度量——或者如果饭菜按顺序发生，则可能是一个有序度量，但无论哪种方式，对它使用相关系数都是一个非常糟糕的主意。

相反，您可能想要找到诸如“牛肉餐中有多少百分比还含有奶酪？”之类的内容。对于每种成分，以下将返回包含它的膳食数量以及包含它和奶酪的膳食数量。诀窍是COUNT只计算非空值。

SELECT Other.Ingredient, 
       COUNT(*) AS TotalMeals, 
       COUNT(Cheese.Ingredient) AS CheesyMeals
     FROM table Other
LEFT JOIN table Cheese
      ON (Cheese.Ingredient = 'Cheese' 
      AND Cheese.Meal_Num = Other.Meal_Num)
GROUP BY Other.Ingredient

警告:如果您在任何一顿饭中两次包含一种成分，则会返回错误的结果。

编辑:事实证明您对奶酪并不特别感兴趣。你真的想要所有的“相关性”对。因此，我们可以将“奶酪”抽象出来，并称它们为第一和第二成分。我在这个中添加了一个“PossibleScore”，它试图表现得像膳食的百分比，但如果该成分的实例很少，则不会给出很高的分数。

SELECT First.Ingredient, 
       Second.Ingredient, 
       COUNT(*) AS MealsWithFirst, 
       COUNT(First.Ingredient) AS MealsWithBoth,
       COUNT(First.Ingredient) / (COUNT(*) + 3) AS PossibleScore,
     FROM table First
LEFT JOIN table Second
      ON (First.Meal_Num = Second.Meal_Num)
GROUP BY First.Ingredient, Second.Ingredient

按分数排序时，这应该返回

PASTA    CHEESE    2    2    0.400
CHEESE   PASTA     3    2    0.333
BEEF     CHEESE    1    1    0.250
BEEF     PASTA     1    1    0.250
FISH     CHEESE    1    1    0.250
FISH     PASTA     1    1    0.250
CHICKEN  CHEESE    1    1    0.250
PASTA    BEEF      2    1    0.200
PASTA    FISH      2    1    0.200
CHEESE   BEEF      3    1    0.167
CHEESE   FISH      3    1    0.167
CHEESE   CHICKEN   3    1    0.167

关于sql - 关联 varchar 值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6834744/

27

4

0

文章推荐： string - Groovy 说我的 Unicode 字符串太长

文章推荐： hibernate - (moxy) jaxb 编码(marshal)处理和 hibernate 代理对象

cassandra - 如何在 presto 中将 varchar 转换为 MAP(VARCHAR,VARCHAR)
我在 presto 中有表，名为(“mappings”)的列将键值对作为字符串从 hello 中选择映射；例如:{“foo”:“baar”，“foo1”:“bar1”} 我想将“映射”列转换为 M
php - Mysql varchar 唯一列 varchar(255) 与 varchar(50)
我总是会在表格的特定列中输入 20 个字符的内容。我需要此列是唯一的。如果我将此列设置为 varchar(255) 而不是 varchar(20)，SELECT 查询的速度会有任何差异吗？ (输入
varchar - Dapper 和 varchars
我在 the Dapper .NET project home page 上发现了以下评论. Dapper supports varchar params, if you are executing
varchar - 将 VARCHAR 转换为数据类型 INT
我有以下代码。 Case 语句将列出的数字转换为文本并将其余代码转换为 NULL，但我不断收到以下错误:将 VARCHAR 值“RDG5”转换为数据类型 INT 时转换失败。 RDG5 是被转换为 N
sql-server - varchar 值隐式转换为 varchar - 排序规则冲突
运行此脚本时出现以下错误。我尝试过使用以下内容:整理 Latin1_General_CI_AS。请问可以排序吗？谢谢 Msg 457, Level 16, State 1, Line 8 Implic
sql - Varchar(255) 到 Varchar(MAX)
是否可以将 SQL Server 2008 数据库中的列类型从 varchar(255) 更改为 varchar(MAX)，而无需删除表并重新创建？每次我尝试使用它来执行此操作时，SQL Serve
sql varchar(max) 与 varchar(fix)
每次我对选择 varchar(max) 或 varchar(fix) 数据类型感到困惑。假设我有一个大约 5000 个 varchar 的数据列。列不是 null 类型。我应该将其设置为 varch
mysql - 将 varchar 转换为日期并按转换后的 varchar 排序
您好，我遇到问题，我的 friend 拒绝更改字段的数据类型，所以我在使用 order by 时遇到问题，这里是示例数据 04-07-2016(mm-dd-yyyy) 和字段名称名为 regis_da
arrays - 检查表中 varchar[] 和 varchar[][] 列的约束
对于文字游戏，我正在尝试向 VARCHAR 数组添加 CHECK 约束: CREATE TABLE words_games ( gid SERIAL PRIMARY KEY,
mysql - 在另一个 varchar 中查找 varchar 的元素
我有一个 varchar 字段，其内容如下: a,b,c,d e,d,a,c b,q,d,e 我需要执行一个查询，仅选择具有与输入字符串相等的元素的字段的行。前输入:c,a 选择的行: a,b,c,
MySQL - InnoDB 索引 varchar 或索引多个 varchars
大家好，我计划创建包含 10 列的表，该表应该至少有 10,000,000 行，并且在其中，我将有列 description - VARCHAR(600) 和索引。所以问题是，在该列上查询 LIKE
hadoop - VARCHAR(254) 与 VARCHAR(255)
我读过这个question关于MySQL中VARCHAR(254)和VARCHAR(255)的区别。 HiveQL 中是否有必须考虑的类似内容？也许 HiveQL 实现了一些类似于 MySQL 的存储
MySQL:VARCHAR(1024) 与 VARCHAR(512)
在 MySQL 中，VARCHAR(1024) 和 VARCHAR(512) 有什么区别？如果我的项目永远不会超过 512 个字符，那么使用 VARCHAR(1024) 我会失去什么？最佳答案不知
mysql - 为什么不将每个 VARCHAR 都指定为 VARCHAR (65535)？
由于 Varchar 字段的存储要求基于输入的字符串的实际长度，将每个 Varchar 字段指定为最大可能的缺点是什么:Varchar (65535)？那么，除了最大字段 > 255 个字符的 1 个
Presto map (varchar，varchar): How to get all the possible keys for it?
我正在尝试搜索具有数据类型 map(varchar,varchar) 的列。现在访问列的一种方法是使用这个结构，name_of_column[' key ']，它将给出该键的值。但我想知道什么是可能的
sql - varchar(128) 比 varchar(100) 好
快速提问。如果我将使用十进制字段限制或十六进制(比如 16、32、64 而不是 10、20、50)，从存储数据的角度来看是否重要？我问是因为我想知道这是否与 HDD 上的集群有关？谢谢! 最佳答案
sql-server-2005 - varchar(max) = varchar 吗？
我发现我可以写 SELECT CAST(Min(mynumber) AS VARCHAR(Max))+'mystring' AS X 作为 SELECT CAST(Min(mynumber) AS V
varchar - SQL Server Varchar 到 VarBinary 转换
我必须将字符串“johnmelling”值插入到列为的表中[用户密码] varbinary NOT NULL。请有人建议我，插入“johnmelling”的最佳转换是什么？我尝试插入如下， In
sql - varchar(500) 比 varchar(8000) 有优势吗？
我已经在 MSDN 论坛和此处阅读了此内容，但仍然不清楚。我认为这是正确的: Varchar(max) 将存储为文本数据类型，因此有缺点。假设您的字段可靠地少于 8000 个字符。就像我的数据库表中的
mysql - 如何将列的类型从 varchar(30) 更改为 varchar(100)？
我有一个这样描述的表: mysql> describe easy_table; +---------------------+--------------+------+-----+---------

首页

博学

6Ren·AI

商城

sql - 关联 varchar 值