- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个 AWS Redshift
包装器类,可以为我自动从 S3
加载类似类型的负载,我最近将其改编为适用于 Spark
作业,不需要 list ,而是需要稍微不同的 COPY
语句。除了这一种方法,所有其他代码都是可转移和可重用的。由于方法参数不同,PyCharm
向我发出警告,我想知道是否有“最佳实践”方法来执行此操作。
class RedshiftLoader(PrettyStr):
def __init__(self,
s3_credentials=config3.S3_INFO,
redshift_db_credentials=config3.REDSHIFT_POSTGRES_INFO_PROD,
table_name=None,
schema_name=None,
dev_db_credentials=config3.REDSHIFT_POSTGRES_INFO,
safe_load=False,
truncate=False):
...
def copy_to_db(self, database_credentials, copy_from, manifest=False):
"""
Copies data from a file on S3 to a Redshift table. Data must be
properly formatted and in the right order, etc...
:param database_credentials: A dictionary containing the host, port,
database name, username, and password. Keys must match example:
REDSHIFT_POSTGRES_INFO = {
'host': REDSHIFT_HOST,
'port': REDSHIFT_PORT,
'database': REDSHIFT_DATABASE_DEV,
'user': REDSHIFT_USER,
'password': REDSHIFT_PASS
}
:param copy_from: The location of the file on the S3 server.
:param manifest: True if a manifest file is to be used in the copy
step, False otherwise.
:return: None
"""
if not self.table_name:
raise AttributeError('A table must be specified.')
s3_access = self.s3_credentials['aws_access_key_id']
s3_secret = self.s3_credentials['aws_secret_access_key']
manifest = 'MANIFEST' if manifest else ''
logger.info('Accessing {table}'.format(table=self.table_name))
try:
with ppg2.connect(**database_credentials) as conn:
cur = conn.cursor()
if self.truncate:
RedshiftLoader.truncate_table(self.table_name, cur)
load = '''
COPY {table}
FROM '{copy_from}'
CREDENTIALS 'aws_access_key_id={pub};aws_secret_access_key={priv}'
DELIMITER '|'
GZIP
TRIMBLANKS
TRUNCATECOLUMNS
ACCEPTINVCHARS
TIMEFORMAT 'auto'
DATEFORMAT 'auto'
{manifest}
'''.format(
table=self.table_name,
copy_from=copy_from,
pub=s3_access,
priv=s3_secret,
manifest=manifest
)
logger.info('Copying to {table}'.format(
table=self.table_name))
cur.execute(load)
conn.commit()
logger.info('Copy complete.')
except ppg2.Error as e:
logger.critical('Error occurred during load: {error}'.format(
error=e
))
raise
然后是子类:
class SparkRedshiftLoader(RedshiftLoader):
def copy_to_db(self, database_credentials, copy_from):
"""
Copies data from a file on S3 to a Redshift table. Data must be
properly formatted and in the right order, etc...
:param database_credentials: A dictionary containing the host, port,
database name, username, and password. Keys must match example:
REDSHIFT_POSTGRES_INFO = {
'host': REDSHIFT_HOST,
'port': REDSHIFT_PORT,
'database': REDSHIFT_DATABASE_DEV,
'user': REDSHIFT_USER,
'password': REDSHIFT_PASS
}
:param copy_from: The location of the file on the S3 server. Assumes
that it is being passed an 's3n' version of the path (common in Spark
and Hadoop) and will automatically convert to the proper format.
:return: None
"""
if not self.table_name:
raise AttributeError('A table must be specified.')
s3_access = self.s3_credentials['aws_access_key_id']
s3_secret = self.s3_credentials['aws_secret_access_key']
copy_from = copy_from.replace('s3n', 's3')
logging.info('Accessing {table}'.format(table=self.table_name))
try:
with ppg2.connect(**database_credentials) as conn:
cur = conn.cursor()
if self.truncate:
SparkRedshiftLoader.truncate_table(self.table_name, cur)
load = '''
COPY {table}
FROM '{copy_from}'
CREDENTIALS 'aws_access_key_id={pub};aws_secret_access_key={priv}'
DELIMITER '|'
GZIP
TRIMBLANKS
TRUNCATECOLUMNS
ACCEPTINVCHARS
TIMEFORMAT 'auto'
DATEFORMAT 'auto'
CSV
NULL 'null'
'''.format(
table=self.table_name,
copy_from=copy_from,
pub=s3_access,
priv=s3_secret,
)
logging.info('Copying to {table}'.format(
table=self.table_name))
cur.execute(load)
conn.commit()
logging.info('Copy complete.')
except ppg2.Error as e:
logging.info('Error occurred during load: {error}'.format(
error=e
))
raise
如您所见,子类将 manifest
作为参数删除,有一个 replace
语句在第一个中找不到,还有一个略有不同的 COPY
命令。
最佳答案
将 RedshiftLoader._copy_to_db
定义为:
def _copy_to_db(self, database_credentials, copy_from, manifest):
"""
Copies data from a file on S3 to a Redshift table. Data must be
properly formatted and in the right order, etc...
:param database_credentials: A dictionary containing the host, port,
database name, username, and password. Keys must match example:
REDSHIFT_POSTGRES_INFO = {
'host': REDSHIFT_HOST,
'port': REDSHIFT_PORT,
'database': REDSHIFT_DATABASE_DEV,
'user': REDSHIFT_USER,
'password': REDSHIFT_PASS
}
:param copy_from: The location of the file on the S3 server.
:param manifest: True if a manifest file is to be used in the copy
step, False otherwise.
:return: None
"""
if not self.table_name:
raise AttributeError('A table must be specified.')
s3_access = self.s3_credentials['aws_access_key_id']
s3_secret = self.s3_credentials['aws_secret_access_key']
logger.info('Accessing {table}'.format(table=self.table_name))
try:
with ppg2.connect(**database_credentials) as conn:
cur = conn.cursor()
if self.truncate:
RedshiftLoader.truncate_table(self.table_name, cur)
load = '''
COPY {table}
FROM '{copy_from}'
CREDENTIALS 'aws_access_key_id={pub};aws_secret_access_key={priv}'
DELIMITER '|'
GZIP
TRIMBLANKS
TRUNCATECOLUMNS
ACCEPTINVCHARS
TIMEFORMAT 'auto'
DATEFORMAT 'auto'
{manifest}
'''.format(
table=self.table_name,
copy_from=copy_from,
pub=s3_access,
priv=s3_secret,
manifest=manifest
)
logger.info('Copying to {table}'.format(
table=self.table_name))
cur.execute(load)
conn.commit()
logger.info('Copy complete.')
except ppg2.Error as e:
logger.critical('Error occurred during load: {error}'.format(
error=e
))
raise
这个和RedshiftLoader.copy_to_db
唯一的区别是manifest
没有默认值,使用前不修改它的值。现在,在每个类中定义copy_to_db
:
class RedshiftLoader(PrettyStr):
def copy_to_db(self, database_credentials, copy_from, manifest=False):
manifest = 'MANIFEST' if manifest else ''
self._copy_to_db(database_credentials, copy_from, manifest)
class SparkRedshiftLoader(RedshiftLoader):
def copy_to_db(self, database_credentials, copy_from):
copy_from = copy_from.replace('s3n', 's3')
self._copy_to_db(database_credentials, copy_from, "CSV NULL 'null'")
私有(private)方法抽象出所有公共(public)代码(几乎是全部);公共(public)方法提供了一个地方,可以以适合类的方式修改 copy_from
和 manifest
的值。
请注意,manifest
可能不是最好的参数名称,因为它的使用方式各不相同。但请注意,在这两种情况下,它只是附加到共享查询末尾的一些特定于类的 SQL。
可以使用您将 spark
bool 值传递给 copy_to_db
的想法在一个类中完成相同的重构。
关于python - 方法参数不同时共享代码的继承最佳实践?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38334374/
只是想知道是否有可能找出谁从 Windows 共享中读取了文件(最好使用 .NET,但 win32 native 可以)? 我想做的是创建类似 awstats 的东西对于 Windows 共享,这样我
是否可以列出 Intent.ACTION_SEND ?我的意思是我需要知道是否有人通过 action_send 在 Facebook 上分享或在 Twitter 上发推文。 最佳答案 也许你想要一个更
我正在使用 Google Apps 应用程序。实际上,我想在不使用密码的情况下访问另一个 ID。我使用了 OAuth,它运行良好。但我无法分享特定人的日历。我尝试了以下代码。 GoogleOAuthP
我怎样才能只创建模拟器...可能吗?我知道,设备需要分发证书。 最佳答案 您只需将应用程序目录从 iPhone 模拟器复制到另一个实例/操作系统版本,它就应该可以工作。 因此,如果您想分发 3.1.3
我想使用多阶段构建来避免每次构建应用程序时都下载我的 Java 项目所需的所有 Maven 依赖项。 我正在考虑在第一阶段解决 Maven 依赖项,然后在第二阶段构建应用程序,这将需要访问在前一阶段下
我正在寻找保护用户下载内容的初步想法。用户下载充满有趣资源的 zip 文件,这些资源被提取到本地文件系统中以供应用程序使用。我的目标是防止用户通过互联网将下载的资源共享给其他用户(假设他们获得了对文件
我想知道在具有移动和桌面版本的网站上共享身份验证、 session 管理等的最佳方法是什么。我们正在运行 Tomcat,并且更愿意将移动站点和桌面站点的应用程序保持在不同的节点上。 我看过类似的帖子,
我发现了这个单例的实现。我怎样才能创建指向它的指针或共享指针?` 为什么这不起作用?自动测试 = Singleton::Instance(); class Singleton { public: st
我有一个 heroku 项目,我想与其他人分享。作为the instructions describe ,我使用 virtualenv 来管理环境和依赖项。有没有办法在新机器上从 requiremen
Maven 将所有 jar 存储在本地存储库 ~/.m2/repository/ 下。用户多时占用空间大。 那么,是否可以由多个用户共享这个本地存储库,或许在不同的目录结构下? 最佳答案 简单的回答
为什么共享 worker 在重新加载页面时死了?应该是复活了我该如何解决这个问题? 重装前 重新加载后(在example.com上按F5) parent worker var port = new S
我正在开发多个小型应用程序,这些应用程序将共享通用和共享模块和 Assets 。 关于如何创建项目结构的部分在这里回答:https://stackoverflow.com/a/61254557/135
我在 RHEL 上安装了 jenkins (localhost:8080),我能够成功地构建代码 现在,我想设置主/从代理。 我的笔记本电脑将充当“Master Jenkins”,而我同事的笔记本电脑
我有这种方法可以根据我使用的 EXTRA_STREAM 共享文本文件或图片。我有这两个我可以选择 i.putExtra(Intent.EXTRA_STREAM, uri); i.putExtra(In
我正在使用 R 中的一个数据分析项目,我正在使用 R 中的敏感私有(private)数据进行一些逻辑和多级建模。我爱上了 。预订 包,我已经创建了一本关于我们的工作流程和分析管道的相当广泛的书。问题是
我正在构建的应用程序需要在 UITabBarController 框架内为多个 View (及其 subview )显示共享的自定义 UIToolbar。自定义工具栏的内容在所有 View 中都是相同
我有多个应用程序,我想共享相同的 eslint 配置: - project_root/ - app1/ - node_modules/ - eslint.rc
我有多个 Electron 应用程序。一个是主应用程序,其他几个功能应用程序。主应用程序上的按钮很少,这将导致功能应用程序打开。这里的问题是每个应用程序都有一个主进程,该进程导致要利用更多的CPU。是
我正在开发一个 Node.js 后端,它通过 websocket 与一些桌面客户端进行通信,而服务器端的通信是从 Web 前端发起的。一切正常,因为我将 SockJS Connection 实例存储在
我对托管多个网站的服务器上的多个用户帐户使用私有(private) SSH key 和无密码条目。 我为每个用户帐户使用相同的私钥。 (因为我很懒?或者那是“正确”的方式)。 我现在想授权该国不同地区
我是一名优秀的程序员,十分优秀!