gpt4 book ai didi

Python pandas DataFrame操作的实现代码

转载 作者:qq735679552 更新时间:2022-09-28 22:32:09 32 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python pandas DataFrame操作的实现代码由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

1. 从字典创建dataframe 。

?
1
2
3
4
5
6
7
8
9
>>> import pandas as pd
>>> dict1 = { 'col1' :[ 1 , 2 , 5 , 7 ], 'col2' :[ 'a' , 'b' , 'c' , 'd' ]}
>>> df = pd.dataframe(dict1)
>>> df
   col1 col2
0   1  a
1   2  b
2   5  c
3   7  d

2. 从列表创建dataframe (先把列表转化为字典,再把字典转化为dataframe) 。

?
1
2
3
4
5
6
7
8
9
>>> lista = [ 1 , 2 , 5 , 7 ]
>>> listb = [ 'a' , 'b' , 'c' , 'd' ]
>>> df = pd.dataframe({ 'col1' :lista, 'col2' :listb})
>>> df
   col1 col2
0   1  a
1   2  b
2   5  c
3   7  d

3. 从列表创建dataframe,指定data和columns 。

?
1
2
3
4
5
6
7
8
9
>>> a = [ '001' , 'zhangsan' , 'm' ]
>>> b = [ '002' , 'lisi' , 'f' ]
>>> c = [ '003' , 'wangwu' , 'm' ]
>>> df = pandas.dataframe(data = [a,b,c],columns = [ 'id' , 'name' , 'sex' ])
>>> df
   id   name sex
0 001 zhangsan  m
1 002   lisi  f
2 003  wangwu  m

4. 修改列名,从['id','name','sex']修改为['id','name','sex'] 。

?
1
2
3
4
5
6
>>> df.columns = [ 'id' , 'name' , 'sex' ]
>>> df
   id   name sex
0 001 zhangsan  m
1 002   lisi  f
2 003  wangwu  m

5. 调整dataframe列顺序、调整列编号从1开始 。

http://www.zzvips.com/article/177058.html 。

6. dataframe随机生成10行4列int型数据 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
>>> import pandas
>>> import numpy
>>> df = pandas.dataframe(numpy.random.randint( 0 , 100 ,size = ( 10 , 4 )), columns = list ( 'abcd' )) # 0,100指定随机数为0到100之间(包括0,不包括100),size = (10,4)指定数据为10行4列,column指定列名
>>> df
   a  b  c  d
0 67 28 37 66
1 21 27 43 37
2 73 54 98 85
3 40 78  4 93
4 99 60 63 16
5 48 46 24 61
6 59 52 62 28
7 20 74 36 64
8 14 13 46 60
9 18 44 70 36

7. 用时间序列做index名 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
>>> df # 原本index为自动生成的0~9
   a  b  c  d
0 31 25 45 67
1 62 12 61 88
2 79 36 20 97
3 26 57 50 44
4 24 12 50  1
5  4 61 99 62
6 40 47 52 27
7 83 66 71  4
8 58 59 25 62
9 38 81 60  8
>>> import pandas
>>> dates = pandas.date_range( '20180121' ,periods = 10 )
>>> dates # 从20180121开始,共10天
datetimeindex([ '2018-01-21' , '2018-01-22' , '2018-01-23' , '2018-01-24' ,
         '2018-01-25' , '2018-01-26' , '2018-01-27' , '2018-01-28' ,
         '2018-01-29' , '2018-01-30' ],
        dtype = 'datetime64[ns]' , freq = 'd' )
>>> df.index = dates # 将dates赋值给index
>>> df
        a  b  c  d
2018 - 01 - 21 31 25 45 67
2018 - 01 - 22 62 12 61 88
2018 - 01 - 23 79 36 20 97
2018 - 01 - 24 26 57 50 44
2018 - 01 - 25 24 12 50  1
2018 - 01 - 26  4 61 99 62
2018 - 01 - 27 40 47 52 27
2018 - 01 - 28 83 66 71  4
2018 - 01 - 29 58 59 25 62
2018 - 01 - 30 38 81 60  8

8. dataframe 实现类sql操作 。

pandas官方文档 comparison with sql 。

https://pandas.pydata.org/pandas-docs/stable/comparison_with_sql.html 。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我.

原文链接:https://www.cnblogs.com/huahuayu/p/8227494.html 。

最后此篇关于Python pandas DataFrame操作的实现代码的文章就讲到这里了,如果你想了解更多关于Python pandas DataFrame操作的实现代码的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com