python - CountVectorizer 错误 : No such file or directory-6ren

python - CountVectorizer 错误 : No such file or directory

转载作者：太空宇宙更新时间：2023-11-03 20:19:25

25

4

我尝试在文档上使用CountVectorizer，但我一直遇到

No such file or directory: 'id' error.

我的代码:

##%%time
## Creating a 2-level index for goog_s and amaz_s
goog_s['dataset_name'] = 'goog_s'
amaz_s['dataset_name'] = 'amaz_s'
amaz_s.rename(columns = {'title':'name'}, inplace = True)

## Creating a new Dataframe containing both goog_s and amaz_s 
df_s = pd.concat([goog_s, amaz_s], axis = 0, join = 'outer', keys = ['goog_s', 'amaz_s'])

## Creating column info
df_s ["info"] = df_s["name"].astype(str) + " " + df_s["description"]


## Creating countVectorizer
cv = CountVectorizer(input='filename', encoding='iso-8859-1', 
                     decode_error='ignore', analyzer='word',
                    ngram_range=(1,1), stop_words='english',
                    binary=True)

cvRaw = cv.fit_transform(df_s)

我在cvRaw = cv.fit_transform(df_s)行上不断收到错误，内容为FileNotFoundError: [Errno 2] No such file or directory: 'id' 。

我的数据框df_s包含一个名为id的列。我不知道为什么我会收到此错误。

最佳答案

您应该将 input 参数作为 'content' 提供，否则它将查找具有 fit() 中提供的列表给出的名称的文件。在您的情况下，它将是 df_s 数据帧的列名称，因为如果您使用数据帧进行迭代，它将返回列名称。

更多说明请参阅 documentation 。

此外，对于 fit()，您需要提供一个迭代器，这意味着 pd.Series。

我不确定您的意图，以下是我的建议。

cvRaw = cv.fit_transform(df_s['info'])

关于python - CountVectorizer 错误 : No such file or directory，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58252353/

25

4

0

文章推荐： matlab - 从对象数组中获取最小属性值

文章推荐： html - 使用 CSS 在标签内居中放置标签

文章推荐： matlab - 在 MATLAB 中生成高斯数据集

安卓工作室 : Parameter 'directory' is not a directory
当我尝试构建我的项目时，我遇到了这样的错误: FAILURE: Build failed with an exception. * What went wrong: Execution failed
海湾合作委员会 : directory : No such file or directory
我正在尝试从 Here 构建适用于 linux 3.7 内核的 Mali 驱动程序. 有一个单独的构建脚本，例如， #!/bin/bash export KDIR=/path/to/kernel/di
directory - 普通口齿不清 : creating a directory
有没有一种方法可以使用普通的 lisp 创建目录。我想先创建一个文件夹，然后将我的 .txt .png 文件放入其中。我知道首先我可以在外部创建文件夹，然后使用 with-open-file 等在目录
visual-studio-2013 - 如何修复 MSB8029 : Intermediate directory or Output directory cannot reside under the Temporary directory in VS2013
Visual Studio 提示每次编译警告 MSB8029:中间目录或输出目录不能位于临时目录下，因为它可能导致增量构建出现问题。我正在检查项目并更改了输出目录和中间目录，但我仍然在我的解决方案中
visual-studio-2013 - 如何修复 MSB8029 : Intermediate directory or Output directory cannot reside under the Temporary directory in VS2013
Visual Studio 提示每次编译警告 MSB8029:中间目录或输出目录不能位于临时目录下，因为它可能导致增量构建出现问题。我正在检查项目并更改了输出目录和中间目录，但我仍然在我的解决方案中
azure-active-directory - 将 Azure Active Directory 与 Keycloak 集成时，是否需要高级版 Azure Active Directory？
我的客户安装了 Keycloak 以从 AWS Cognito 代理用户。我需要这个 Keycloak 来代理来自 Azure Active Directory 的用户。客户拥有 AAD 的 OF
multithreading - GNU 并行 : assign one thread for each node (directories and sub* directories) of an entire tree from a start directory
我想从 macOS 上 parallel 命令的所有潜力中受益(似乎存在 2 个版本，GNU 和 Ole Tange 的版本，但我不确定)。使用以下命令: parallel -j8 find {}
active-directory - Active Directory 本地管理器
我需要实现一个 Active Directory(本地)管理器，用户可以在其中执行所有任务，例如添加用户、删除用户、分配许可证和分配组等。用户有用户名、密码和域 Controller 名称，所以他只需
active-directory - Active Directory LDAP示例
我正在编写一个使用PHP adLDAP库与Active Directory交互的应用程序。为了测试该应用程序，我需要使用Active Directory架构的本地LDAP DB以及示例数据。我已经
active-directory - Active Directory 跨域搜索
我有一个包含两个域 AA.RR.COM 和 BB.RR.COM 的 Active Directory 林，其中包含用户和组。我需要搜索两个域中的用户，同时查询其中一个域(例如 AA.RT.COM)如何
active-directory - Active Directory 用户类的电子邮件地址属性与代理地址属性之间的差异
我使用 Proxy-Address 属性作为确定用户电子邮件地址的主要方法(我只关心以“SMTP:”或“smtp:”为前缀的地址，此外，我使用以大写字母为前缀的地址SMTP 来确定主地址 - 这不是
PHP警告: mkdir(): Not a directory when creating directory
这个问题不太可能对任何 future 的访客有帮助；它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用，visit the
Linux 命令 : Directory inside a directory
所以我有一个目录 - 让我们说/dir/。在里面我有这些文件夹-/目录/fold1//目录/fold2//dir/fold3/ 这些文件夹 (fold1,2,3) 中的每一个都可能包含一个名为 foo
php - 如何设置服务器以在 Ubuntu 10.04 中从 "root-directory/sub-directory/cgi-bin"运行 "root-directory/cgi-bin"中的 perl 脚本？
我正在使用 PHPmotion 在我本地的 ubuntu 机器上。优步上传者在 phpmotion 中用于将文件上传到服务器。这是使用 perl 脚本(位于“ www/cgi-bin ”)上传文件。
active-directory - 使用 Active Directory 用户登录到您的应用程序是否是个好主意
我正在为我的公司开发一个基于 Web 的 Intranet。我只想知道用户使用事件目录登录详细信息登录应用程序是一件好事，还是我应该与应用程序数据库一起创建登录名。如果有什么比这更好的，请提出建议。这
active-directory - Sitecore Active Directory 间接成员资格
我们有带有 AD 模块 1.0.4 的 Sitecore 6.5。 DEPARTMENT\SitecoreUsers AD 组中的用户可以登录 Sitecore，但 DEPARTMENT\Siteco
active-directory - Active Directory memberof 属性不包含嵌套的安全组
我使用的 AD 设置具有存储为(多个)安全组成员的用户。我正在使用读取用户的 memberof 属性的软件来计算访问权限。在 AD Explorer 中，我可以看到用户的 memberof 属性显
active-directory - 支持使用 Active Directory 进行单点登录
我们有一个在 .NET 上编写的 SaaS 应用程序，我们需要为我们的客户提供各种 SSO 方法。不久前，我们对 OpenID 进行了标准化，希望这会成为一个通用标准，让我们不必支持不同的标准。不幸
active-directory - 如何复制和设置测试 Active Directory DC
我有 .Net 代码可以读取/写入我们本地的 Active Directory 域。阅读部分已经过测试并且工作正常，但我想测试“写作”部分。我的应用程序将修改事件目录中的一些用户配置文件，但我不想在实
active-directory - 在 Active Directory 中查找域名
我正在运行一个 ASP.NET 4.0 应用程序，它使用用户名(即 HttpContext.Current.Request.LogonUserIdentity.Name.ToString())来管理对

首页

博学

6Ren·AI

商城

python - CountVectorizer 错误 : No such file or directory