- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是一组日期时间值:
array = np.array(['2016-05-01T00:00:59.3+10:00', '2016-05-01T00:02:59.4+10:00',
'2016-05-01T00:03:59.4+10:00', '2016-05-01T00:13:00.1+10:00',
'2016-05-01T00:22:00.5+10:00', '2016-05-01T00:31:01.1+10:00'],
dtype=object)
pd.to_datetime
非常擅长推断日期时间格式。
array = pd.to_datetime(array)
print(array)
DatetimeIndex(['2016-04-30 14:00:59.300000', '2016-04-30 14:02:59.400000',
'2016-04-30 14:03:59.400000', '2016-04-30 14:13:00.100000',
'2016-04-30 14:22:00.500000', '2016-04-30 14:31:01.100000'],
dtype='datetime64[ns]', freq=None)
我如何动态地找出推断出的日期时间格式 pd.to_datetime
?类似于:%Y-%m-%dT...
(抱歉,我的 datetime foo 真的很糟糕)。
最佳答案
我认为不可能在 pandas 中完全通用地做到这一点。
如其他评论和答案中所述,内部函数 _guess_datetime_format
接近您的要求,但它对构成可猜测格式的内容有严格的标准,因此它仅适用于受限制的日期时间字符串类。
这些条件在 these lines 上的 _guess_datetime_format
函数中列出。您还可以在 test_parsing 中看到一些格式好的和坏的示例。脚本。
一些要点是:
这意味着它将无法猜测问题中日期时间字符串的格式,尽管它们是有效的 ISO 8601。格式:
>>> from pandas.core.tools.datetimes import _guess_datetime_format_for_array
>>> array = np.array(['2016-05-01T00:00:59.3+10:00'])
>>> _guess_datetime_format_for_array(array)
# returns None
在这种情况下,删除时区并将微秒填充到六位数足以让 pandas 识别格式:
>>> array = np.array(['2016-05-01T00:00:59.300000']) # six digits, no tz
>>> _guess_datetime_format_for_array(array)
'%Y-%m-%dT%H:%M:%S.%f'
这可能已经很好了。
如果 pd.to_datetime
没有被要求推断数组的格式,或者给定一个格式字符串来尝试,它只会尝试分别解析每个字符串并希望它成功。至关重要的是,它不需要提前推断格式来执行此操作。
首先,pandas 解析字符串,假设它是 ( approximately ) ISO 8601 格式。这始于对 _string_to_dts
的调用并最终达到低水平parse_iso_8601_datetime
完成艰苦工作的功能。
您可以使用_test_parse_iso8601
检查您的字符串是否能够以这种方式被解析。功能。例如:
from pandas._libs.tslib import _test_parse_iso8601
def is_iso8601(string):
try:
_test_parse_iso8601(string)
return True
except ValueError:
return False
您提供的数组中的日期被识别为这种格式:
>>> is_iso8601('2016-05-01T00:00:59.3+10:00')
True
但这并没有提供问题的要求,而且我没有看到任何现实的方法来恢复 parse_iso_8601_datetime
函数识别的确切格式。
如果将字符串解析为 ISO 8601 格式失败,pandas 会回退到使用 parse()
来自第三方 dateutil 库的函数(由 parse_datetime_string
调用)。这提供了极佳的解析灵 active ,但同样,我不知道有什么好方法可以从此函数中提取可识别的日期时间格式。
如果这两个解析器都失败,pandas 要么引发错误,要么忽略字符串,要么默认为 NaT
(取决于用户指定的内容)。不再尝试解析字符串或猜测字符串的格式。
关于python - 日期时间转换 - 如何提取推断格式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51275976/
当使用模板模板参数时,我如何推断或删除模板模板的模板类型? 考虑以下 SSCCE: #include #include #include using namespace std; templat
假设我有一些特质: trait A[T] { def foo: T } 一个扩展它的类: class B[T](t: T) extends A[T] { def foo = t } 以及父特征的子特征
一边玩-rectypes在某些时候选择 OCaml 我只是迷路了。 这个表达式几乎可以打字: # fun x -> x x;; - : ('a -> 'b as 'a) -> 'b = 但是这里 O
我正在编写一个类似 CRUD 的应用程序,并且通过主键进行大量查找(主键可以有不同的类型)。所以我定义了以下类型类: {-# LANGUAGE MultiParamTypeClasses #-} cl
我已经创建了关系 A 'is functional parent of' B并定义 'has functional parent'作为 'is functional parent of' 的倒数. '
给定一个使用 Kotlin 版本 1.3.61 和 JOOQ 版本 3.13.1 的系统,这样的方法会构建 union正常查询: val selectCommonPart = coalesce
考虑以下错误代码: fun x = if (null x) then 0 else (take 50 x) : (fun (drop 50 x)) 我注意到,我可以毫无问题地将它加载到
给定一个具有以下类型的函数 a: a::x -> Bool 和以下类型的另一个函数 b: b::Bool -> y 我正在尝试找出推断以下函数类型的步骤: c =\d -> d a b 有人可以帮助解
我正在尝试使用 Infer 工具来分析我的应用代码。我关注了these steps每次我尝试运行 infer -- gradle build 时,我都会收到以下错误: infer -- gradle
所以我制作了这个模板来定义内联仿函数: template struct AsFunctor { template std::invoke_result_t operator()(A
是否可以推断 CRTP 基类中模板化成员函数的返回类型? 虽然推断参数类型效果很好,但它因返回类型而失败。考虑以下示例。 #include template struct base { tem
使用 Series.interpolate 很容易在 Pandas.DataFrame 中插入值,如何进行外推? 例如,给定一个如图所示的 DataFrame,我们如何将它外推 14 个月到 2014
我想知道为什么这不起作用(缺少参数类型)? Seq(1,2,3).toSet.map(_ + 1) 但这确实: val foo = Seq(1,2,3).toSet foo.map(_ + 1)
我没有必要使用 SQLite3 shell 工具来维护一个小型数据库。我正在使用 -header -ascii标志,尽管据我所知,这适用于任何输出选择。我正在寻找一种方法来避免对返回的任何一个值的类型
我有以下组件 type PropTypes = { items: T[], header: (item: T) => React.Element, body: (item: T) => R
我想在 Eclipse/JSDT 中指定实例变量的类型,如下例所示: /** * @constructor */ function A() { /** @type Node */
我正在用 Python 编写一个方法,它看起来像这样: def rgb_to_grayscale(image): print(image.shape) pass 此处预期的类型是 nu
我有一个 my_values 数组,我正在尝试为其推断 true_values 数组中最接近、较小的值。使用下面的 find_nearest 函数并不能完成我想要的。我如何追加它以找到最近的、较小的值
在下面的代码中: template int b(int q, const std::array& types) { int r = q; for (int t : types)
在 Pandas DataFrame 中插入 NaN 单元非常容易: In [98]: df Out[98]: neg neu pos av
我是一名优秀的程序员,十分优秀!