gpt4 book ai didi

c++ - 纪元秒 (UTC) 的日期字符串

转载 作者:太空狗 更新时间:2023-10-29 21:31:47 25 4
gpt4 key购买 nike

问题

我想将以字符串 (UTC) 形式给出的日期时间解析为自 纪元 以来的秒数。示例(参见 EpochConverter ):

2019-01-15 10:00:00 -> 1547546400

问题

直接的解决方案,在一个非常相关的问题中也被接受 C++ Converting a time string to seconds from the epoch使用 std::get_time 然后 std::mktime 进入 std::string -> std::tm -> std::time_t:

std::tm tm;
std::stringstream ss("2019-01-15 10:00:00");
ss >> std::get_time(&tm, "%Y-%m-%d %H:%M:%S");
std::time_t epoch = std::mktime(&tm);
// 1547546400 (expected)
// 1547539200 (actual, 2 hours too early)

但是 std::mktime 似乎由于时区的原因弄乱了时间。我正在从 UTC+01:00 执行代码,但我们在那个日期也有夏令时,所以这里是 +2

对于 std::get_time 之后的 hour 字段,tm 显示 15。一进入 std::mktime 就乱了。

因此,字符串将被解释为 UTC 时间戳,不应涉及任何时区。但是我提出的所有解决方案似乎都将其解释为本地时间戳并为其添加偏移量。


限制

我对此有一些限制:

  • C++17
  • 独立于平台/编译器
  • 没有环境变量黑客攻击
  • 没有外部库(比如 boost)

尽管出于问答的目的,请随意发布涉及这些内容的答案,但我不会接受它们。


研究

我找到了各种解决这个问题的尝试,但都没有满足我的要求:

  • std::mktime(如上所述),弄乱了时间,因为它采用本地时间
  • strptime,在我的平台上不可用,不是标准的一部分
  • timegm(这正是我需要的),与平台无关
  • _mkgmtime,与平台无关
  • boost::posix_time::from_iso_string,是一个外部库
  • std::chrono::date::parse,不适用于 C++17
  • 使用tzset清除并重置时区变量,使用环境变量hacking
  • 使用 mktime(localtime(&timestamp)) - mktime(gmtime(&timestamp)) 手动计算偏移量,计算出错误的偏移量,因为它不考虑 DST(在我的平台上为 1 小时,但它需要 2 小时)

最佳答案

C++20 之前的解决方案:自己动手。

有了正确的文档,它确实比听起来容易得多,如果您不需要太多错误检测,甚至可以快如闪电。

第一个问题是在不操纵任何数字的情况下解析数字。您只需要读取长度为 2 位和 4 位的无符号值,所以只需做到最低限度即可:

int
read2(std::string const& str, int pos)
{
return (str[pos] - '0')*10 + (str[pos+1] - '0');
}

int
read4(std::string const& str, int pos)
{
return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
(str[pos+2] - '0')*10 + (str[pos+3] - '0');
}

现在给定一个字符串,很容易解析出你需要的不同值:

// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
auto y = read4(str, 0);
auto m = read2(str, 5);
auto d = read2(str, 8);
...

通常让人感到困惑的部分是如何将三元组 {y, m, d} 转换为自 1970-01-01 以来/之前的天数。这是一个可以帮助你做到这一点的 collection of public domain calendrical algorithms。这不是第 3 方日期/时间库。这是一个关于编写您自己的日期/时间库所需的算法的教程。而且这些算法高效。没有迭代。没有大 table 。这使它们对管道和缓存非常友好。他们在 +/- 一百万年的时间跨度内进行了单元测试。因此,您不必担心会触及它们的任何正确性界限。如果您对它们的工作原理感兴趣,这些算法也有非常深入的推导。

所以只需转到 collection of public domain calendrical algorithms ,选​​择您需要的算法(并根据需要自定义它们),然后推出您自己的转换器。

例如:

#include <cstdint>
#include <limits>
#include <string>

int
days_from_civil(int y, unsigned m, unsigned d) noexcept
{
static_assert(std::numeric_limits<unsigned>::digits >= 18,
"This algorithm has not been ported to a 16 bit unsigned integer");
static_assert(std::numeric_limits<int>::digits >= 20,
"This algorithm has not been ported to a 16 bit signed integer");
y -= m <= 2;
const int era = (y >= 0 ? y : y-399) / 400;
const unsigned yoe = static_cast<unsigned>(y - era * 400); // [0, 399]
const unsigned doy = (153*(m + (m > 2 ? -3 : 9)) + 2)/5 + d-1; // [0, 365]
const unsigned doe = yoe * 365 + yoe/4 - yoe/100 + doy; // [0, 146096]
return era * 146097 + static_cast<int>(doe) - 719468;
}

int
read2(std::string const& str, int pos)
{
return (str[pos] - '0')*10 + (str[pos+1] - '0');
}

int
read4(std::string const& str, int pos)
{
return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
(str[pos+2] - '0')*10 + (str[pos+3] - '0');
}

// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
auto y = read4(str, 0);
auto m = read2(str, 5);
auto d = read2(str, 8);
auto h = read2(str, 11);
auto M = read2(str, 14);
auto s = read2(str, 17);
return days_from_civil(y, m, d)*86400LL + h*3600 + M*60 + s;
}

#include <iostream>

int
main()
{
std::cout << EpochConverter("2019-01-15 10:00:00") << '\n';
}

这只是为我输出:

1547546400

加入适合您的应用程序的任何错误检测。

关于c++ - 纪元秒 (UTC) 的日期字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57304285/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com