- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有以下简单的代码,导致有关缓存的错误:
trips_in = sc.textFile("trip_data.csv")
trips = trips_in.map(lambda l: l.split(",")).map(lambda x: parseTrip(x)).cache()
trips.count()
函数parseTrip()
获取字符串列表并创建并返回一个Trip类:
class Trip:
def __init__(self, id, duration):
self.id = id
self.duration = duration
我在执行 count()
操作后立即收到错误。但是,如果我删除第二行末尾的 cache()
,一切都会正常工作。根据错误,问题是 Trip 类无法被 pickle:
PicklingError: Can't pickle __main__.Trip: attribute lookup __main__.Trip failed
那么我怎样才能让它变得可挑选(如果它是一个实际的单词)?请注意,我使用的是 Databricks 笔记本,因此我无法为类定义创建单独的 .py 以使其可挑选。
最佳答案
环境不会影响答案 - 如果您想使用自定义类,它必须可以在集群中的每个节点上导入。
对于单个模块,您可以轻松使用 SparkContext.addPyFile
以及 GitHub Gist 的 URL (或其他支持的格式:“file in HDFS (or other Hadoop-supported filesystems), or anHTTP, HTTPS or FTP URI ”)
在笔记本中调用:
sc.addPyFile(raw_gist_url)
对于复杂的依赖关系,您可以分发 Egg 文件。
创建Python package using setuptools
.
目录结构:
.
├── setup.py
└── trip
└── __init__.py
示例设置文件:
#!/usr/bin/env python
from setuptools import setup
setup(name='trip',
version='0.0.1',
description='Trip',
author='Jane Doe',
author_email='jane@example.com',
url='https://example.com',
packages=['trip'],)
创建egg文件:
python setup.py bdist_egg
这将创建包含 trip-0.0.1-pyX.Y.egg
文件的 dist
目录
转到 Databricks 仪表板 -> 新建 -> 库并从 dist 目录上传 Egg 文件:
将库附加到您要使用的集群。
最后,如果您想要的只是记录类型,则可以使用 namedtuple
,无需任何其他步骤:
from collections import namedtuple
Trip = namedtuple('Trip', ['id', 'duration'])
关于python - 使用 pyspark 缓存简单 RDD 时出错,而没有缓存代码则工作正常(How to make a class picklable in a Notebook),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42491179/
我并不总是编写 make 文件,但当我这样做时,我喜欢尝试并写好它们。试图使界面与其他开发人员的期望一致始终是一项艰巨的任务。我正在寻找的是所有常见的 make some clean (GNU) ma
例如,我在运行 makefile 时收到这样的错误: make[3]: *** [/home/ziga/Downloads/openwrt/rakun_openwrt/staging_dir/ho
我必须创建一个 Makefile,它从不同文件夹中的 .c 文件创建单个可执行文件。 .c 文件包含来自任何这些文件夹的头文件。根目录有3个子目录x/y、x/z、a,所有这些子目录都有一些.c和.h文
您好,我有一个简单的 MakeFile,其中包含: clean: rm -f ex1 但是当我运行命令make clean 时,出现以下错误: make: *** No rule to mak
我已经为一些软件安装了它,但现在我根本不使用那个软件,所以我需要移除MinGW才能使用Cygwin进行Android开发。。我使用的是64位Windows 7
以下是针对我遇到的问题的简化生成文件: all: /tmp/makey/../filey @echo All done /tmp/filey: @echo Filey 当我运行 mak
获取错误: make: *** No rule to make target all. Stop." 在安装nagios主机期间运行此命令make all 最佳答案 可能的常见错误: 确保将文件命名为
当使用 -jN 运行 gnu-make 规则时,make 会创建 jobserver用于管理跨子制造商的工作数量。此外,您可以通过在 make 配方前添加 + 前缀来“将作业服务器环境传递”到 mak
使用 GNU Make 4.1 概括 我调用一个子品牌 b.mk来自生成文件 a.mk .b.mk被调用以确保构建子系统。 有时我想强制一个目标为 a.mk重制: make -f a.mk --al
这个问题与问题 2543127 的精神相似。 . 我有一个带有头文件列表的 gnu makefile。每个头文件可能位于不同的目录中,例如, HEADERS = $(wildcard *.h) $(w
假设我有以下 GNU make 目标: create_dir: @mkdir objects build_asm: $(ASM_FILES) @echo
我有一个具有以下结构的 Makefile(工作示例)。 .PHONY: image flashcard put-files put-files: @echo "=== put-files" i
我想要一个这样的makefile: cudaLib : # Create shared library with nvcc ocelotLib : # Create shared li
有没有比更好的方法来获取 GNU make 变量的第一个字符 FIRST=$(shell echo $(VARIABLE) | head -c 1) (不仅笨重而且还要调用外部shell)? 最佳答案
我通常使用像 cmake 这样的高级构建系统来构建我的 C/C++ 代码。但是由于各种原因,我直接使用 GNU make。 我正在进行递归构建,其中每个目录都有一个 makefile。 我最近不得不将
我通常使用像 cmake 这样的高级构建系统来构建我的 C/C++ 代码。但是由于各种原因,我直接使用 GNU make。 我正在进行递归构建,其中每个目录都有一个 makefile。 我最近不得不将
我安装了最新的mingw,发现没有mingw32-make了。有make.exe,所以我想知道最近是否将mingw32-make重命名为make.exe。 最佳答案 我不知道您从哪里获得 MinGW,
我正在使用 CentOS,但由于一个错误,许多软件包被删除了。所以我没有 yum 和 rpm。所以我想从源代码手动制作 yum,但我也没有制作。我知道一切都会用“制作包”制作。但是 make 自己呢?
考虑这个Makefile: .PHONY: all all: main.txt main.txt: build/main.txt cp build/main.txt . %/main.txt:
假设目录输入中有 1000 个扩展名为 .xhtml 的文件,并且这些文件的某个子集(输出路径在 $(FILES) 中)需要通过 xslt 转换为目录输出中具有相同名称的文件.一个简单的 make 规
我是一名优秀的程序员,十分优秀!