- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的代码。我写了我可以。现在需要你的帮助。告诉我怎么了。我如何屏蔽尽可能多的符号?我不知道如何正确地做,我看书。但仍然没有解决
void TextThread(std::string str)
{
std::ifstream text(str);
if (!text)
std::cout << "No open file" << "\n";
std::istream_iterator<char> input(text);
std::istream_iterator<char> output;
std::vector<char> symvol(input, output);
unsigned maxThreadCount = std::thread::hardware_concurrency();
const std::size_t minLength = symvol.size() / maxThreadCount;
const std::size_t modulo = symvol.size() % maxThreadCount;
std::vector<std::size_t> results;
results.reserve(maxThreadCount);
std::vector<std::thread> threads;
threads.reserve(maxThreadCount - 1);
for (std::size_t i = 0; i < modulo; ++i)
results.emplace_back(minLength + 1);
if (minLength > 0)
{
for (std::size_t i = modulo; i < maxThreadCount; ++i)
results.emplace_back(minLength);
}
for (std::size_t i = 1; i < threads.size(); ++i)
threads.emplace_back(threads[i - 1] + 1, threads[i - 1] + threads[i]);
std::for_each(threads.begin(), threads.end(),
std::mem_fn(&std::thread::join));
for (unsigned int i = 0; i < symvol.size(); ++i)
std::cout << symvol[i] << "\n";
}
int main()
{
TextThread("D:\\text.txt");
return 0;
}
更新:我会在屏幕上显示所有字符
void TextThread(std::string str)
{
std::ifstream text(str);
if (!text)
std::cout << "No open file" << "\n";
std::istream_iterator<char> input(text);
std::istream_iterator<char> output;
std::vector<char> symvol(input, output);
for (unsigned int i = 0; i < symvol.size(); ++i)
std::cout << symvol[i] << "\n";
}
UPD2:
像你一样做。它仍然与多线程有关
using Symbol = std::array<size_t, 256>;
Symbol CountSymbol(std::vector<char> const& data)
{
Symbol countSymbol{};
for (unsigned char ch : data)
countSymbol[ch] += 1;
return countSymbol;
}
Symbol SymbolFile(std::string const& fname)
{
std::ifstream text(fname);
if (!text)
throw std::runtime_error("No open file");
std::vector<char> const data(std::istreambuf_iterator<char>{text}, {});
return CountSymbol(data);
}
int main()
{
Symbol symbol = SymbolFile("D:\\text.txt");
for (int ch = 0; ch <= 255; ++ch)
{
if (symbol[ch])
{
if (std::isprint(ch))
std::cout << "Character '" << char(ch) << "' occurs " <<
symbol[ch] << " times\n";
else
std::cout << "Character #" << ch << " occurs " << symbol[ch]
<< " times\n";
}
}
}
UPD3
#include "stdafx.h"
#include <iostream>
#include <fstream>
#include <iterator>
#include <algorithm>
#include <string>
#include <vector>
#include <unordered_map>
#include <thread>
#include <cctype>
#include <clocale>
#include <numeric>
std::vector<std::pair<std::size_t, std::size_t>> GenerateIntervals(const
std::vector<char>& text)
{
std::size_t maxThreadCount = std::thread::hardware_concurrency();
const std::size_t minLength = text.size() / maxThreadCount;
const std::size_t modulo = text.size() % maxThreadCount;
std::vector<std::size_t> intervalLengthPerThread;
intervalLengthPerThread.reserve(maxThreadCount);
for (std::size_t i = 0; i < modulo; ++i)
intervalLengthPerThread.emplace_back(minLength + 1);
if (minLength > 0)
{
for (std::size_t i = modulo; i < maxThreadCount; ++i)
intervalLengthPerThread.emplace_back(minLength);
}
std::vector<std::pair<std::size_t, std::size_t>> intervals;
intervals.reserve(intervalLengthPerThread.size());
intervals.emplace_back(0, 0 + intervalLengthPerThread[0] - 1);
for (std::size_t i = 1; i < intervalLengthPerThread.size(); ++i)
intervals.emplace_back(intervals[i - 1].second + 1, intervals[i - 1].second + intervalLengthPerThread[i]);
return intervals;
}
void BuildHistogram(const std::pair<std::size_t, std::size_t>& textRange,
const std::vector<char>& text, std::unordered_map<char, std::size_t>&
histogram)
{
for (std::size_t i = textRange.first; i < textRange.second; ++i)
++histogram[text[i]];
}
std::vector<char> ReadDataFromFile(const std::string& pathToFile)
{
std::ifstream stream(pathToFile);
if (!stream)
{
std::vector<char> result;
std::cout << "Can not open file" << "\n";
return result;
}
std::istream_iterator<char> it(stream);
std::istream_iterator<char> itEnd;
std::vector<char> text(it, itEnd);
}
int main()
{
auto text = ReadDataFromFile("D:\\text.txt");
const auto textIntervals = GenerateIntervals(text);
const auto usedThreadCount = textIntervals.size();
std::vector<std::unordered_map<char, size_t>> histograms(usedThreadCount);
std::vector<std::thread> threads(usedThreadCount);
for (std::size_t i = 0; i < usedThreadCount; ++i)
threads[i] = std::thread(BuildHistogram, std::cref(textIntervals[i]), text, std::ref(histograms[i]));
for (std::size_t i = 0; i < usedThreadCount; ++i)
threads[i].join();
std::unordered_map<char, size_t> histogram;
for (const auto& hist : histograms)
{
for (const auto& pair : hist)
histogram[pair.first] += pair.second;
}
for (int ch = 0; ch < 256; ++ch)
{
if (text[ch])
{
std::cout << "Character '" << char(ch) << "' occurs " << text[ch] << " times\n";
}
}
return 0;
最佳答案
我会在这里提供帮助,因为你迷路了。
我认为你想要一个直方图,比如:
std::array<size_t, 256> histo;
这里,每个元素对应输入字符的整数值(比如a
是97)。
下面是简单的实现:
using Histo = std::array<size_t, 256>;
Histo histogram(std::vector<char> const& data) {
Histo histo {}; // value initialize, makes sure all elements are 0
for (auto ch : data) {
histo[ch] += 1;
}
return histo;
}
Note There's a very subtle thing here where I convert the character to
unsigned char
(could also sayuint8_t
). This is because some platforms will havechar
be signed and that leads to errors when indexinghisto[ch]
or when comparing (e.g.ch <= 255
would always be true).
您可以像这样对文件的内容进行操作:
Histo histogram_file(std::string const& fname) {
std::ifstream text(fname);
if (!text)
throw std::runtime_error("No open file");
std::vector<char> const data(std::istreambuf_iterator<char>{text}, {});
return histogram(data);
}
Note The use of
istreambuf_iterator
does not skip whitespace (asistreambuf_iterator
does by default, see http://en.cppreference.com/w/cpp/io/manip/skipws).
简单代码 Live On Coliru
#include <thread>
#include <vector>
#include <string>
#include <fstream>
#include <iostream>
#include <iterator>
using Histo = std::array<size_t, 256>;
Histo histogram(std::vector<char> const& data) {
Histo histo {}; // value initialize, makes sure all elements are 0
for (unsigned char ch : data) {
histo[ch] += 1;
}
return histo;
}
Histo histogram_file(std::string const& fname) {
std::ifstream text(fname);
if (!text)
throw std::runtime_error("No open file");
std::vector<char> const data(std::istreambuf_iterator<char>{text}, {});
return histogram(data);
}
int main() {
Histo histo = histogram_file("main.cpp");
for (int ch = 0; ch <= 255; ++ch) {
if (histo[ch]) {
if (std::isprint(ch))
std::cout << "Character '" << char(ch) << "' occurs " << histo[ch] << " times\n";
else
std::cout << "Character #" << ch << " occurs " << histo[ch] << " times\n";
}
}
}
打印类似的东西
Character #10 occurs 41 times
Character ' ' occurs 224 times
Character '!' occurs 1 times
Character '"' occurs 16 times
Character '#' occurs 7 times
...
Character 'x' occurs 3 times
Character 'y' occurs 1 times
Character 'z' occurs 2 times
Character '{' occurs 9 times
Character '}' occurs 9 times
要分发工作,我们必须调用 histogram
对于 vector 数据的一部分。让我们稍微修改我们的函数来实现这一点:
template <typename Iterator> // could just use `char const*` but let's not
Histo histogram(Iterator begin, Iterator end) {
Histo histo {}; // value initialize, makes sure all elements are 0
for (auto it = begin; it != end; ++it) {
histo[*it] += 1;
}
return histo;
}
Histo histogram(std::vector<char> const& data) {
return histogram(data.begin(), data.end());
}
如您所见,我们可以将“旧”签名直接转发到新的、更灵活的界面。当然你可以对 char const*
挑剔。直接并具有完全相同的代码,但如果输入与 vector 有任何不同,它就无法正常工作。或者如果它变成了 std::deque<unsigned char>
等等
我们希望将工作分成相等的 block :
using It = std::vector<char>::const_iterator;
// calculate chunk size
auto chunk = data.size() / num_threads;
if (chunk*num_threads < data.size()) chunk += 1;
Note that the last chunk could be extend (
因为你不能(有用地)分享 Histo
所有线程之间的对象(同步访问的成本将远远超过并发处理的任何速度优势),我们必须有 Histo
每个线程。
让我们先笨拙地手动操作:
////////////////////////////////////////////
// start chunk threads
struct worker_t {
Histo local; // histogram per thread
std::thread th;
void run(It begin, It end) {
local = histogram(begin, end);
}
};
std::vector<worker_t> workers(num_threads);
现在我们可以开始了 run
在每个工作实例上,传递计算的子范围:
int i = 0;
for (auto& w : workers) {
auto begin = data.begin()+chunk*i,
end = std::min(begin + chunk, data.end());
w.th = std::thread(&worker_t::run, std::ref(w), begin, end);
++i;
}
////////////////////////////////////////////
// wait for completion
for (auto& w : workers) {
if (w.th.joinable())
w.th.join();
};
这几乎是您已经拥有的。
////////////////////////////////////////////
// merge results
Histo histo;
for (auto& w : workers) {
merge_into(histo, w.local);
}
return histo;
注意编写你想阅读的代码,然后再实现更多细节的习惯。在这种情况下,我们仍然定义了 merge_into
:
void merge_into(Histo& into, Histo const& part) {
for (auto& p : part)
into[p.first] += p.second;
}
以上 Live On Coliru 和 MSVC on RexTester
#include <thread>
#include <vector>
#include <string>
#include <fstream>
#include <iostream>
#include <iterator>
#include <map>
using Histo = std::map<char, size_t>;
void merge_into(Histo& into, Histo const& part) {
for (auto& p : part)
into[p.first] += p.second;
}
template <typename Iterator> // could just use `char const*` but let's not
Histo histogram(Iterator begin, Iterator end) {
Histo histo {}; // value initialize, makes sure all elements are 0
for (auto it = begin; it != end; ++it) {
histo[*it] += 1;
}
return histo;
}
Histo histogram(std::vector<char> const& data) {
return histogram(data.begin(), data.end());
}
Histo parallel_histo(std::vector<char> const& data, size_t num_threads = std::thread::hardware_concurrency()) {
using It = std::vector<char>::const_iterator;
// calculate chunk size
auto chunk = data.size() / num_threads;
if (chunk*num_threads < data.size()) chunk += 1;
////////////////////////////////////////////
// start chunk threads
struct worker_t {
Histo local; // histogram per thread
std::thread th;
void run(It begin, It end) {
local = histogram(begin, end);
}
};
std::vector<worker_t> workers(num_threads);
int i = 0;
for (auto& w : workers) {
auto begin = data.begin()+chunk*i,
end = std::min(begin + chunk, data.end());
w.th = std::thread(&worker_t::run, std::ref(w), begin, end);
++i;
}
////////////////////////////////////////////
// wait for completion
for (auto& w : workers) {
if (w.th.joinable())
w.th.join();
};
////////////////////////////////////////////
// merge results
Histo histo;
for (auto& w : workers) {
merge_into(histo, w.local);
}
return histo;
}
Histo histogram_file(std::string const& fname) {
std::ifstream text(fname);
if (!text)
throw std::runtime_error("No open file");
return parallel_histo({std::istreambuf_iterator<char>{text}, {}});
}
int main() {
Histo histo = histogram_file("main.cpp");
for (int ch = 0; ch <= 255; ++ch) {
if (histo[ch]) {
if (std::isprint(ch))
std::cout << "Character '" << char(ch) << "' occurs " << histo[ch] << " times\n";
else
std::cout << "Character #" << ch << " occurs " << histo[ch] << " times\n";
}
}
}
打印与之前相同的输出。
分配接受输入和生成结果的任务的“标准库”是使用 std::async
它可以简单地返回结果。它并不完美,但工作量少得多:
Histo parallel_histo(std::vector<char> const& data, size_t num_threads = std::thread::hardware_concurrency()) {
// calculate chunk size
auto chunk = data.size() / num_threads;
if (chunk*num_threads < data.size()) chunk += 1;
////////////////////////////////////////////
// start tasks
std::vector<std::future<Histo> > tasks(num_threads);
int i = 0;
for (auto& t : tasks) {
auto begin = data.begin()+chunk*i,
end = std::min(begin + chunk, data.end());
t = std::async([=,&data] { return histogram(begin, end); });
}
Histo histo;
for (auto& t : tasks) {
merge_into(histo, t.get());
}
return histo;
}
当然,如果你真的了解标准库,你就会使用它(c++17):
#include <atomic>
#include <execution>
#include <algorithm>
using Histo = std::vector<std::atomic_size_t>;
Histo histogram(std::vector<char> const& data) {
Histo histo(256);
std::for_each(std::execution::par_unseq, data.begin(), data.end(), [&histo](unsigned char ch) { ++histo[ch]; });
return histo;
}
Histo histogram_file(std::string const& fname) {
std::ifstream text(fname);
if (!text)
throw std::runtime_error("No open file");
return histogram({std::istreambuf_iterator<char>{text}, {}});
}
遗憾的是您还不能使用它,因为没有编译器供应商实际(完全)实现它。
关于c++ - 通过多线程判断每个字符在一个文件中出现了多少次,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48316402/
我需要将文本放在 中在一个 Div 中,在另一个 Div 中,在另一个 Div 中。所以这是它的样子: #document Change PIN
奇怪的事情发生了。 我有一个基本的 html 代码。 html,头部, body 。(因为我收到了一些反对票,这里是完整的代码) 这是我的CSS: html { backgroun
我正在尝试将 Assets 中的一组图像加载到 UICollectionview 中存在的 ImageView 中,但每当我运行应用程序时它都会显示错误。而且也没有显示图像。 我在ViewDidLoa
我需要根据带参数的 perl 脚本的输出更改一些环境变量。在 tcsh 中,我可以使用别名命令来评估 perl 脚本的输出。 tcsh: alias setsdk 'eval `/localhome/
我使用 Windows 身份验证创建了一个新的 Blazor(服务器端)应用程序,并使用 IIS Express 运行它。它将显示一条消息“Hello Domain\User!”来自右上方的以下 Ra
这是我的方法 void login(Event event);我想知道 Kotlin 中应该如何 最佳答案 在 Kotlin 中通配符运算符是 * 。它指示编译器它是未知的,但一旦知道,就不会有其他类
看下面的代码 for story in book if story.title.length < 140 - var story
我正在尝试用 C 语言学习字符串处理。我写了一个程序,它存储了一些音乐轨道,并帮助用户检查他/她想到的歌曲是否存在于存储的轨道中。这是通过要求用户输入一串字符来完成的。然后程序使用 strstr()
我正在学习 sscanf 并遇到如下格式字符串: sscanf("%[^:]:%[^*=]%*[*=]%n",a,b,&c); 我理解 %[^:] 部分意味着扫描直到遇到 ':' 并将其分配给 a。:
def char_check(x,y): if (str(x) in y or x.find(y) > -1) or (str(y) in x or y.find(x) > -1):
我有一种情况,我想将文本文件中的现有行包含到一个新 block 中。 line 1 line 2 line in block line 3 line 4 应该变成 line 1 line 2 line
我有一个新项目,我正在尝试设置 Django 调试工具栏。首先,我尝试了快速设置,它只涉及将 'debug_toolbar' 添加到我的已安装应用程序列表中。有了这个,当我转到我的根 URL 时,调试
在 Matlab 中,如果我有一个函数 f,例如签名是 f(a,b,c),我可以创建一个只有一个变量 b 的函数,它将使用固定的 a=a1 和 c=c1 调用 f: g = @(b) f(a1, b,
我不明白为什么 ForEach 中的元素之间有多余的垂直间距在 VStack 里面在 ScrollView 里面使用 GeometryReader 时渲染自定义水平分隔线。 Scrol
我想知道,是否有关于何时使用 session 和 cookie 的指南或最佳实践? 什么应该和什么不应该存储在其中?谢谢! 最佳答案 这些文档很好地了解了 session cookie 的安全问题以及
我在 scipy/numpy 中有一个 Nx3 矩阵,我想用它制作一个 3 维条形图,其中 X 轴和 Y 轴由矩阵的第一列和第二列的值、高度确定每个条形的 是矩阵中的第三列,条形的数量由 N 确定。
假设我用两种不同的方式初始化信号量 sem_init(&randomsem,0,1) sem_init(&randomsem,0,0) 现在, sem_wait(&randomsem) 在这两种情况下
我怀疑该值如何存储在“WORD”中,因为 PStr 包含实际输出。? 既然Pstr中存储的是小写到大写的字母,那么在printf中如何将其给出为“WORD”。有人可以吗?解释一下? #include
我有一个 3x3 数组: var my_array = [[0,1,2], [3,4,5], [6,7,8]]; 并想获得它的第一个 2
我意识到您可以使用如下方式轻松检查焦点: var hasFocus = true; $(window).blur(function(){ hasFocus = false; }); $(win
我是一名优秀的程序员,十分优秀!