- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章探究C++中string类的实现原理以及扩展使用由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
C++程序员编码过程中经常会使用string(wstring)类,你是否思考过它的内部实现细节。比如这个类的迭代器是如何实现的?对象占多少字节的内存空间?内部有没有虚函数?内存是如何分配的?构造和析构的成本有多大?笔者综合这两天阅读的源代码及个人理解简要介绍之,错误的地方望读者指出.
首先看看string和wstring类的定义:
1
2
|
typedef
basic_string<
char
, char_traits<
char
>, allocator<
char
> > string;
typedef
basic_string<
wchar_t
, char_traits<
wchar_t
> allocator<
wchar_t
> > wstring;
|
从这个定义可以看出string和wstring分别是模板类basic_string对char和wchar_t的特化.
再看看basic_string类的继承关系(类方法未列出):
最顶层的类是_Container_base,它也是STL容器的基类,Debug下包含一个_Iterator_base*的成员,指向容器的最开始的元素,这样就能遍历容器了,并定义了了两个函数 。
1
2
|
void
_Orphan_all()
const
;
// orphan all iterators
void
_Swap_all(_Container_base_secure&)
const
;
// swaps all iterators
|
Release下_Container_base只是一个空的类.
_String_base类没有数据成员,只定义了异常处理的三个函数:
1
2
3
|
static
void
_Xlen();
// report a length_error
static
void
_Xran();
// report an out_of_range error
static
void
_Xinvarg();
|
_String_val包含一个alloctor的对象,这个类也非常简单,除了构造函数没有定义其它函数。 上面三个基类都定义得很简单,而basic_string类的实现非常复杂。不过它的设计和大多数标准库一样,把复杂的功能分成几部分去实现,充分体现了模块的低耦合。 迭代器有关的操作交给_String_iterator类去实现,元素相关的操作交给char_traits类去实现,内存分配交给allocator类去实现.
_String_iterator类的继承关系如下图:
这个类实现了迭代器的通用操作,比如:
1
2
3
4
5
6
7
8
9
10
11
12
|
reference operator*()
const
;
pointer operator->()
const
_String_iterator & operator++()
_String_iterator operator++(
int
)
_String_iterator& operator--()
_String_iterator operator--(
int
)
_String_iterator& operator+=(difference_type _Off)
_String_iterator operator+(difference_type _Off)
const
_String_iterator& operator-=(difference_type _Off)
_String_iterator operator-(difference_type _Off)
const
difference_type operator-(
const
_Mybase& _Right)
const
reference operator[](difference_type _Off)
const
|
有了迭代器的实现,就可以很方便的使用算法库里面的函数了,比如将所有字符转换为小写:
1
2
|
string s(
"Hello String"
);
transform(s.begin(), s.end(), s.begin(),
tolower
);
|
char_traits类图如下:
这个类定义了字符的赋值,拷贝,比较等操作,如果有特殊需求也可以重新定义这个类.
allocator类图如下:
这个类使用new和delete完成内存的分配与释放等操作。你也可以定义自己的allocator,msdn上有介绍哪些方法是必须定义的.
再看看basic_string类的数据成员:
_Mysize表示实际的元素个数,初始值为0; 。
_Myres表示当前可以存储的最大元素个数(超过这个大小就要重新分配内存),初始值是_BUF_SIZE-1; 。
_BUF_SIZE是一个enum类型:
1
2
3
4
|
enum
{
// length of internal buffer, [1, 16]
_BUF_SIZE = 16 /
sizeof
(_Elem) < 1 ? 1: 16 /
sizeof
(_Elem)
};
|
从这个定义可以得出,针对char和wchar_t它的值分别是16和8。 _Bxty是一个union:
1
2
3
4
5
|
union
_Bxty
{
// storage for small buffer or pointer to larger one
_Elem _Buf[_BUF_SIZE];
_Elem *_Ptr;
} _Bx;
|
为什么要那样定义_Bxty呢,看下面这段代码:
1
2
3
4
|
_Elem * _Myptr()
{ // determine
current
pointer
to
buffer
for
mutable string
return
(_BUF_SIZE <= _Myres ? _Bx._Ptr : _Bx._Buf);
}
|
这个函数返回basic_string内部的元素指针(c_str函数就是调用这个函数)。 所以当元素个数小于_BUF_SIZE时不用分配内存,直接使用_Buf数组,_Myptr返回_Buf。否则就要分配内存了,_Myptr返回_Ptr.
不过内存分配策略又是怎样的呢?看下面这段代码:
1
2
3
4
5
6
7
8
9
|
void _Copy(size_type _Newsize, size_type _Oldlen)
{ // copy _Oldlen elements
to
newly allocated buffer
size_type _Newres = _Newsize | _ALLOC_MASK;
if (max_size() < _Newres)
_Newres = _Newsize; // undo roundup if too big
else
if (_Newres / 3 < _Myres / 2 && _Myres <= max_size() - _Myres / 2)
_Newres = _Myres + _Myres / 2; // grow exponentially if possible
//other code
}
|
_ALLOC_MASK的值是_BUF_SIZE-1。这段代码看起来有点复杂,简单描述就是:最开始_Myres每次增加_BUF_SIZE,当值达到一定大小时每次增加一半。 针对char和wchar_t,每次分配内存的临界值分别是(超过这些值就要重新分配):
1
2
|
char:15,31,47,70,105,157,235,352,528,792,1188,1782。。。
wchar_t:7, 15, 23, 34, 51, 76, 114, 171, 256, 384, 576, 864, 1296, 1944。。。
|
重新分配后都会先将旧的元素拷贝到新的内存地址。所以当处理一个长度会不断增长而又大概知道最大大小时可以先调用reserve函数预分配内存以提高效率.
string类占多少字节的内存空间呢?
_Container_base Debug下含有一个指针,4字节,Release下是空类,0字节。_String_val类含有一个allocator对象。string类使用默认的allocator类,这个类没有数据成员,不过按字节对齐的原则,它占4字节。basic_string类的成员加起来是24,所以总共是32字节(Debug)或28字节(Relase)。wstring也是32或28,至于原因文中已经分析.
综上所述:string和wstring类借助_String_iterator实现迭代器操作,都占32(Debug)或28(Release)字节的内存空间,没有虚函数,构造和析构开销较低,内存分配比较灵活.
扩展string类 在实际开发过程中,C++string类使用起来有很多不方便的地方,笔者根据根据这些不足简单的扩展了这个类,如增加与数字之间的相互转化和格式化字符串。不足的地方望指正。读者也可以根据自己需求继续扩展.
头文件:exstring.h 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
|
/*
Author: wuqiang
Email: debugroot@126.com
Description:exstring is a subclass of basic_string.It is added some userful
operations,such as toUpper,toLower,toNumber,fromNumber,format,etc.It can also
convert between basic_string seamlessly,which is very important for compatibility.
And it is almostly a wrapper of some C++ standard library,so there should be no bugs.
If you find some,please let me known.It is totally free,you can use it in any way you desire.
*/
#pragma once
#include <string>
#include <stdarg.h>
#include <algorithm>
#include <sstream>
#include <iomanip>
using
namespace
std;
#ifndef INLINE
#define INLINE inline
#endif //INLINE
static
ios_base::fmtflags BaseFlag(
int
base)
{
return
(base == 16) ? (ios_base::hex) :
( (base == 8) ? (ios_base::oct) : (ios_base::dec) );
}
template
<
class
_Elem>
struct
ex_char_traits
{
};
template
<>
struct
ex_char_traits<
char
>
{
static
INLINE
int
ct_vscprintf(
const
char
* format,
va_list
argptr )
{
return
_vscprintf(format, argptr);
}
static
INLINE
int
ct_vstprintf_s(
char
* buffer,
size_t
numberOfElements,
const
char
* format,
va_list
argptr)
{
return
vsprintf_s(buffer, numberOfElements, format, argptr);
}
};
template
<>
struct
ex_char_traits<
wchar_t
>
{
static
INLINE
int
ct_vscprintf(
const
wchar_t
* format,
va_list
argptr )
{
return
_vscwprintf(format, argptr);
}
static
INLINE
int
ct_vstprintf_s(
wchar_t
* buffer,
size_t
numberOfElements,
const
wchar_t
* format,
va_list
argptr)
{
return
vswprintf_s(buffer, numberOfElements, format, argptr);
}
};
template
<
class
_Elem,
class
_Traits,
class
_Ax,
class
Type>
Type ConvertToNumber(basic_stringstream<_Elem, _Traits, _Ax>& ss,
Type t,
int
base)
{
ss.setf(BaseFlag(base), ios_base::basefield);
ss >> t;
return
t;
}
template
<
class
_Elem,
class
_Traits,
class
_Ax>
float
ConvertToNumber(basic_stringstream<_Elem, _Traits, _Ax>& ss,
float
t,
int
/*ignore base*/
)
{
ss >> t;
return
t;
}
template
<
class
_Elem,
class
_Traits,
class
_Ax>
double
ConvertToNumber(basic_stringstream<_Elem, _Traits, _Ax>& ss,
double
t,
int
/*ignore base*/
)
{
ss >> t;
return
t;
}
template
<
class
_Elem,
class
_Traits,
class
_Ax,
class
_ExTraits>
class
basic_exstring :
public
basic_string<_Elem, _Traits, _Ax>
{
public
:
typedef
basic_exstring<_Elem, _Traits, _Ax, _ExTraits> _Myt;
typedef
basic_string<_Elem, _Traits, _Ax> _Mybase;
#pragma region "constructor"
//所有构造函数的行为同basic_string
explicit
INLINE _Myt(
const
_Ax& al = _Ax())
:_Mybase(al)
{
}
INLINE _Myt(
const
_Myt& rhs)
:_Mybase(rhs)
{
}
INLINE _Myt(
const
_Myt& rhs, size_type pos, size_type n,
const
_Ax& al = _Ax())
:_Mybase(rhs, pos, n, al)
{
}
INLINE _Myt(
const
_Elem *s, size_type n,
const
_Ax& al = _Ax())
:_Mybase(s, n, al)
{
}
INLINE _Myt(
const
_Elem *s,
const
_Ax& al = _Ax())
:_Mybase(s, al)
{
}
INLINE _Myt(size_type n, _Elem c,
const
_Ax& al = _Ax())
:_Mybase(n, c, al)
{
}
INLINE _Myt(const_iterator first, const_iterator last,
const
_Ax& al = _Ax())
:_Mybase(first, last, al)
{
}
//string(wstring)转化为exstring(exwstring)
INLINE _Myt(
const
_Mybase& base)
:_Mybase(base)
{
}
#pragma endregion //constructor
#pragma region "general operation"
//所有字符转为大写,改变自身
_Myt& toUpper()
{
transform(begin(), end(), begin(),
toupper
);
return
*
this
;
}
//所有字符转为大写,不改变自身
_Myt toUpper()
const
{
_Myt s;
transform(begin(), end(), s.begin(),
toupper
);
return
s;
}
//所有字符转为小写,改变自身
_Myt& toLower()
{
transform(begin(), end(), begin(),
tolower
);
return
*
this
;
}
//所有字符转为大写,不改变自身
_Myt toLower()
const
{
_Myt s(_Mysize, _Elem());
transform(begin(), end(), s.begin(),
tolower
);
return
s;
}
//将所有oldStr替换为newStr
_Myt& replace(
const
_Myt& oldStr,
const
_Myt& newStr)
{
if
(oldStr.empty())
return
*
this
;
size_type index;
while
( (index = find(oldStr)) != npos )
_Mybase::replace(index, oldStr.size(), newStr);
return
*
this
;
}
//删除左边所有包含在target中的字符
_Myt& trimLeft(
const
_Myt& target)
{
while
(!empty() && (target.find(*begin()) != npos))
erase(begin());
return
*
this
;
}
//删除右边所有包含在target中的字符
_Myt& trimRight(
const
_Myt& target)
{
while
(!empty() && target.find(*rbegin()) != npos)
erase(--end());
return
*
this
;
}
//返回左边count个字符,count大于总长度则返回整个字符串
_Myt left(size_type count)
const
{
return
substr( 0, count );
}
//返回右边count个字符,count大于总长度则返回整个字符串
_Myt right(size_type count)
const
{
return
substr( _Mysize < count ? 0 : _Mysize - count );
}
//忽略大小写判断两个字符串是否相等
int
compareNoCase(
const
_Myt& rhs)
const
{
return
toLower().compare(rhs.toLower());
}
//判断字符串是否以制定字符串开头
bool
beginWith(
const
_Myt& rhs)
const
{
return
find(rhs) == size_type(0);
}
//判断字符串是否以制定字符串结尾
bool
endWith(
const
_Myt& rhs)
const
{
if
(rhs.size() > _Mysize)
return
false
;
return
compare(_Mysize - rhs.size(), rhs.size(), rhs) == 0;
}
#pragma endregion //general operation
#pragma region "convert between numbers"
//将字符串转为数字
//base:进制数。可以为8,10,16,如果其它值则强制为10。浮点数则忽略此参数
template
<
typename
T>
T toNumber (
int
base = 10)
const
{
T t = T();
basic_stringstream<_Elem, _Traits, _Ax> ss(_Myptr());
return
ConvertToNumber<_Elem, _Traits, _Ax>(ss, t, base);
}
//将整数转化为字符串
//base:进制数。可以为8,10,16,如果其它值则强制为10
template
<
typename
T>
static
_Myt fromNumber ( T number,
int
base = 10 )
{
basic_stringstream<_Elem, _Traits, _Ax> ss;
ss.setf(BaseFlag(base), ios_base::basefield);
ss << number;
return
ss.str();
}
//将float转化为字符串
//f:格式化参数。可以为'f','e','E','g','G'。'f'为定点数,'e'或'E'表示科学计数法
// 'g'或‘G'表示格式化为定点数或科学计数法,看哪一个表示方便。
//prec:小数点后的位数(定点数表示法)或总的有效位数(科学计数法)
static
_Myt fromNumber (
float
number, _Elem f = _Elem(
'g'
),
int
prec = 6 )
{
return
fromNumber(
static_cast
<
double
>(number), f, prec);
}
//将double转化为字符串,参数解释同上
static
_Myt fromNumber (
double
number, _Elem f = _Elem(
'g'
),
int
prec = 6 )
{
basic_stringstream<_Elem, _Traits, _Ax> ss;
ss << setprecision(prec);
if
( _Traits::eq(f, _Elem(
'f'
)) )
ss << setiosflags(ios_base::fixed);
else
if
( _Traits::eq(f, _Elem(
'e'
)) || _Traits::eq(f, _Elem(
'E'
)) )
ss << setiosflags(ios_base::scientific);
ss << number;
return
ss.str();
}
#pragma endregion //convert between numbers
#pragma region "format string"
//将szFormat格式化为字符串,参数解释同sprintf
void
format(
const
_Elem* szFormat, ...)
{
if
(!szFormat)
return
;
va_list
argList;
va_start
(argList, szFormat);
formatV(szFormat, argList);
va_end
(argList);
}
//将szFormat格式化为字符串,参数解释同sprintf
void
formatV(
const
_Elem* szFormat,
va_list
argList)
{
if
(!szFormat)
return
;
int
nLength = _ExTraits::ct_vscprintf(szFormat, argList);
if
(nLength < 0)
return
;
resize(nLength);
_ExTraits::ct_vstprintf_s(_Myptr(), nLength + 1, szFormat, argList);
va_end
(argList);
}
#pragma endregion //format string
};
typedef
basic_exstring<
char
, char_traits<
char
>,
allocator<
char
>, ex_char_traits<
char
> > exstring;
typedef
basic_exstring<
wchar_t
, char_traits<
wchar_t
>,
allocator<
wchar_t
>, ex_char_traits<
wchar_t
> > exwstring;
|
使用举例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
|
#include <iostream>
#include <tchar.h>
#include "exstring.h"
#ifdef _UNICODE
typedef
exwstring tstring;
#define tcout wcout
#else
typedef
exstring tstring;
#define tcout cout
#endif //_UNICODE
int
main(
int
argc,
char
* argv[])
{
tstring s(_T(
"\t Hello ExString\r\n"
));
tcout << _T(
"result of triming left:"
) << s.trimLeft(_T(
"\t "
)) << endl;
tcout << _T(
"result of triming right:"
) << s.trimRight(_T(
"\r\n"
)) << endl;
tcout << _T(
"result of compare"
) << s.compareNoCase(_T(
"hello exstring"
)) << endl;
tcout << _T(
"result of converting to upper:"
) << s.toUpper() << endl;
tcout << _T(
"result of converting to lower:"
) << s.toLower() << endl;
tcout << _T(
"the left 5 chars:"
) << s.left(5) << endl;
tcout << _T(
"the right 8 chars:"
) << s.right(8) << endl;
tcout << _T(
"result of appending:"
) << s.append(_T(
",exstring is practical"
)) << endl;
tcout << _T(
"result of replacing:"
) << s.replace(_T(
"exstring"
), _T(
"Exstring"
)) << endl;
s.format(_T(
"sizeof(%s) is %d(0x%x)"
), _T(
"exstring"
),
sizeof
(exstring),
sizeof
(exstring));
tcout << _T(
"result of formating:"
) << s << endl;
tcout << tstring(_T(
"0xFF"
)).toNumber<
int
>(16) << endl;
tcout << tstring(_T(
"-1"
)).toNumber<unsigned
__int64
>() << endl;
tcout << tstring(_T(
"12.3456789"
)).toNumber<
float
>() << endl;
tcout << tstring::fromNumber(255) << endl;
tcout << _T(
"0x"
) << tstring::fromNumber(
__int64
(-1), 16).toUpper() << endl;
tcout << tstring::fromNumber(12.3456789, _T(
'f'
), 4) << endl;
tcout << tstring::fromNumber(12.3456789, _T(
'E'
), 4) << endl;
return
0;
}
|
输出:
最后此篇关于探究C++中string类的实现原理以及扩展使用的文章就讲到这里了,如果你想了解更多关于探究C++中string类的实现原理以及扩展使用的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 此帖子已于 8 个月
除了调试之外,是否有任何针对 c、c++ 或 c# 的测试工具,其工作原理类似于将独立函数复制粘贴到某个文本框,然后在其他文本框中输入参数? 最佳答案 也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法,例如将分辨率加倍或输入负值,但它永远无法将窗口放在我的第二台显示器上。 关于如何在 C/C++/c# 中执行此操作的任何线索 最
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。 我正在尝试编写一个 C# 程序,它将使用 DES 算法进行加密和解密。我需要一些实
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
有没有办法强制将另一个 窗口置于顶部? 不是应用程序的窗口,而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
假设您可以在 C/C++ 或 Csharp 之间做出选择,并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例,那么构建套接字服务器应用程序的最明智选择是什么? 最佳答案 如
你们能告诉我它们之间的区别吗? 顺便问一下,有什么叫C++库或C库的吗? 最佳答案 C++ 标准库 和 C 标准库 是 C++ 和 C 标准定义的库,提供给 C++ 和 C 程序使用。那是那些词的共同
下面的测试代码,我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端 我想也许我应该使用
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码,但我不想与雇主共享该函数的代码。相反,我只想让他有权在他自己的代码中调用该函数。是否可以?我想到了这两种方法 - 在
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等,
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一些 C 代码,将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6
我是一名优秀的程序员,十分优秀!