python数据清洗工具、方法、过程整理归纳(三、数据清洗之数据表操作——数据筛选、增加删除、查找修改、数据整理和层次化索引)
2020-03-05 06:09
441 查看
文章目录
4 数据表操作
4.1 数据常用筛选方法
- 在数据中,选择需要的行或者列
- 基础索引方式,即直接引用
- loc[行索引名称或者条件,列索引名称或者标签]
- iloc[行索引位置,列索引位置]
- 注意区别loc和iloc
import numpy as np import pandas as pd import os os.chdir('D:\code\jupyter\course\代码和数据') df = pd.read_csv('baby_trade_history.csv',encoding = 'utf-8',dtype = {'user_id':str}) df user_id auction_id cat_id cat1 property buy_mount day 0 786295544 41098319944 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 21896936223 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 3 917056007 12515996043 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 20487688075 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 5 152298847 41840167463 121394024 50008168 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 6 513441334 19909384116 50010557 50008168 25935:21991;1628665:29784;22019:34731;22019:20... 1 20121212 7 297411659 13540124907 50010542 50008168 21458:60020529;25935:31381;1633959:27247291;16... 1 20121212 8 82830661 19948600790 50013874 28 21458:11580;21475:137325 1 20121101 9 475046636 10368360710 203527 28 22724:40168;22729:40278;21458:21817;2770200:24... 1 20121101 10 734147966 15307958346 50018202 38 21458:3270827;7361532:28710594;7397093:7536994... 2 20121101 11 68547330 21162876126 50012365 122650008 1628665:3233941;1628665:3233942;1628665:323393... 1 20121123 12 697081418 15898050723 50013636 50008168 21458:19726868;1633959:179425852;13836282:1290... 1 20121123 13 377550424 15771663914 50015841 28 1628665:3233941;1628665:3233942;3914866:11580;... 1 20121123 14 88313935 22532727492 50013711 50008168 1628665:3233941;1628665:3233942;22019:3340598;... 1 20131005 15 25918750 16078389250 50012359 122650008 21458:3405407;1633959:6186201;1628366:32799;81... 1 20131005 16 350288528 35086271572 50010544 50008168 21458:61813;25935:21991;1628665:3233938;162866... 1 20131129 17 348090113 17436967558 50009540 50014815 21458:21910;3110425:30696849;2191928:75373546;... 1 20131129 18 1635282280 36153356431 50013207 50008168 1628665:29784;1628665:29799;2904342:31004;2201... 1 20131129 19 530850018 22058239899 50024147 28 21458:205007542;43307470:5543413;2339128:62147... 1 20140210 20 749507708 19171641742 50018860 28 21458:3602856;1628665:3233941;1628665:3233942;... 1 20140210 21 201088567 38564176352 50013207 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20140502 22 469517728 8232924597 211122 38 21458:21782;36786:42781029;13023102:6999219;22... 6 20140502 23 691367866 17712372914 121434042 50014815 21458:49341152;8021059:5525523;6851452:1398669... 1 20140804 24 77193822 35537441586 50006520 50014815 22277:6262384;21458:30992;1628665:3233941;1628... 2 20140804 25 605678021 15502618744 50010555 50008168 25935:31381;1628665:3233941;1628665:3233942;16... 1 20130226 26 47702620 26481508332 121412034 50014815 21458:49341152;11057903:4036007;130475532:7537... 1 20140918 27 763560371 40945285800 50012365 122650008 21458:30992;1628665:3233939;22007:30338;22007:... 1 20150201 28 408028533 35838498718 50012442 50008168 21458:3596449;6811831:3446999;13023209:3446999... 1 20141009 29 53566371 27177784760 121394024 50008168 21458:42090508;1628665:3233941;1628665:3233942... 1 20141009 30 69873877 40133707057 50010555 50008168 21458:30992;25935:31381;1628665:3233941;162866... 1 20141017 31 1609185254 42001753405 121394024 50008168 21458:30992;1628665:3233942;1628665:3233936;16... 1 20141228 32 1746148145 41181827319 50012365 122650008 21458:621749996;13023209:12868;122217803:30916... 1 20141228 33 256475742 39059292616 121452056 50008168 1628665:29784;1628665:29782;122217801:50793479... 1 20140711 34 405194127 15462429573 50007011 50008168 21458:35624651;1633959:7320293;1628665:3233941... 1 20120819 35 938309370 14149079479 50023669 28 21458:4204704;11820090:105550653;11644036:2861... 1 20120819 36 84258337 14653740604 50016704 50022520 21458:3394654;5261331:4377028;1633959:4377028;... 1 20120819 37 14466144 17610665576 50011993 28 21458:104000;21475:137325 1 20130327 38 177724549 14228645401 50018824 38 21475:108284;6933666:96059;33595:16453265;2145... 1 20130327 39 727823869 39674261411 121466023 50008168 21458:14332755;1628665:3233941;1628665:3233942... 2 20140813 40 659020106 40484992676 50011993 28 21458:16162126;13023209:10551667;122218042:605... 1 20140813 41 46277938 40070019945 50006602 50008168 21458:29563;10984217:21985;13023209:3488197;21... 1 20140813 42 827091396 18678458676 50010566 50008168 21458:46906;13023209:158751187;25935:21991;320... 1 20140911 43 18100946 38451267766 121540027 28 21458:215485914;125501489:19689726;11945782:78... 1 20140911 44 725813399 40519533209 50010544 50008168 21458:32270;13023209:669513679;25935:21991;162... 1 20140911 45 1054852159 19063296909 50006235 50008168 1628665:3233941;21475:17106236;21475:17106365;... 2 20140703 46 262519726 19051046285 121398041 28 11666049:40203;21458:3961150;17472269:13302841... 1 20140703 47 87207277 14234909614 121470030 50014815 21458:30992;1628665:3233941;1628665:3233942;16... 1 20140703 48 1053602675 20252281923 50013636 50008168 21458:216724052;1628665:29798;1628665:29796;25... 1 20140220 49 103125167 18426669796 50018438 50014815 21458:46896;1628665:3233941;1628665:3233942;21... 16 20140220 ... ... ... ... ... ... ... ... 29921 1372572 16915013171 50008845 28 21458:30992;1628665:3233941;1628665:3233942;16... 1 20130327 29922 646265934 10310068684 50012449 50008168 21458:70899896;8539985:3374457;1633959:3374457... 1 20130823 29923 184923046 15265710813 50006602 50008168 30497:46157;30498:46160;1628665:3233941;162866... 1 20130823 29924 167288532 18836766607 50012788 28 2112993:29274;122277833:104377;1628665:3233941... 1 20140913 29925 54855720 39635136808 50018436 50014815 1628665:3233941;1628665:3233942;1628665:323393... 2 20140913 29926 2183330808 19704833222 50011993 28 21458:119679150;13023209:4067094;122218042:216... 1 20140913 29927 372911996 14288242617 50012438 50014815 21458:8535341;1628665:3233941;5970350:3402020;... 1 20121222 29928 22414724 20959068389 50010544 50008168 21458:61834;25935:21990;1628665:3233941;162866... 1 20121222 29929 113446171 37455013590 50023663 28 11760865:6120557;21458:3314841;122277597:2054;... 1 20140831 29930 522850986 18220260582 122678023 28 21458:91312408;138253785:653822445;135925585:1... 1 20140831 29931 671912471 40608095216 50010558 50008168 25935:21991;1628665:3233942;1628665:3233938;12... 1 20140831 29932 2212582093 16684531006 50006095 28 21458:3532516;8088680:4482698;1628665:3233941;... 1 20150205 29933 712130383 35024165075 50010558 50008168 21458:30992;25935:31381;1628665:29799;12221780... 1 20150205 29934 326432534 40599422228 50012428 28 1628665:3233941;1628665:29790;1628665:3233936;... 1 20150110 29935 1663431626 20045810860 50018831 50014815 21458:3630550;7255245:3630549;27174406:1782825... 2 20150110 29936 1041477880 39339180944 50023591 50022520 1628665:29790;1628665:29778;1628665:3233938;16... 1 20140710 29937 2078287226 40289849863 50013207 50008168 21458:100854706;13023209:647423831;22121:11712... 1 20141029 29938 22270319 35760225761 50023613 50022520 NaN 1 20141029 29939 2074613684 40798454555 203319 28 122217795:29277;134943792:29774;134943792:2977... 1 20141108 29940 1048135914 35165371283 121394024 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20141108 29941 413188001 16521677358 50012478 50014815 21458:28155;5434803:3636603;2815901:22583732;1... 1 20130107 29942 474062095 21129724585 50013207 50008168 21458:21599;1628665:29798;1628665:3233938;1628... 1 20130107 29943 797710454 18176728510 50013177 28 1628665:3233941;1628665:3233942;1628665:323393... 1 20130107 29944 1716505453 37844041565 50010555 50008168 21458:30992;25935:31381;1628665:3233941;162866... 1 20141231 29945 1966692323 42504930457 50012359 122650008 21458:3379652;1628665:3233940;1628665:3233938;... 1 20141231 29946 641734831 22105131076 50014277 50014815 21458:21906;13227811:51479;13230966:75369014;3... 2 20141016 29947 731030177 41666438142 121394024 50008168 21458:3443560;1628665:3233942;1628665:3233938;... 1 20141016 29948 68515755 13953276547 50012788 28 21458:12376977;2112993:32075;1628665:92012;162... 1 20130729 29949 180436843 23375100402 50012451 50008168 21458:33514;1633959:13343071;33030:29800;33162... 1 20130729 29950 801784345 17629938386 50023670 28 21458:3550980;29154281:231350353;11684888:1045... 1 20130729 29951 124458824 19739113764 50013636 50008168 21458:30992;13658074:9306734;1628665:3233941;1... 1 20140322 29952 602141957 37251457564 50012360 122650008 21458:21599;1628665:29798;1628665:82340;162866... 1 20140322 29953 595095853 41160643364 121364022 50008168 21458:80090256;1628665:29784;1628665:29796;162... 1 20150111 29954 1905258237 42298652641 121452056 50008168 21458:30992;1628665:3233942;1628665:31614;1628... 1 20150111 29955 1957645413 36768778465 121448033 38 6940834:29865;1628149:137593;21475:114226;2275... 1 20140815 29956 1854778218 37200665444 50012361 122650008 21458:3645338;13023209:544768204;122217803:309... 1 20140815 29957 268356658 36932456353 50010236 50014815 21458:10513072;12474507:706291650;3091143:9208... 1 20141027 29958 196272909 10066997901 50009540 50014815 21458:21906;13229910:32056435;2191928:73664723... 1 20141104 29959 23473499 38019470815 50010236 50014815 1628665:61550;1628665:3233940;1628665:3233936;... 1 20141104 29960 816394377 19835118833 50003700 28 24448:73774385;6725953:48332;22044:30715;80047... 1 20130912 29961 164859586 15842319049 50012479 28 NaN 1 20130912 29962 119149466 26396292642 50008875 28 21458:30992;11684888:104528258;21475:11488282;... 1 20130912 29963 704655047 10506866020 50007011 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20121206 29964 45662429 20745380642 50010555 50008168 25935:31381;1628665:3233941;1628665:3233942;16... 1 20121206 29965 35711492 16563353438 50010544 50008168 21458:11580;25935:21991;1628665:92012;1628665:... 1 20121206 29966 57747284 35169635909 50010549 50008168 21458:125202070;22019:3228688;22019:3248884;22... 1 20140109 29967 287541325 19778523000 50007011 50008168 21458:112788583;1633959:3523439;3130834:209537... 2 20140109 29968 82915321 12766532512 50011993 28 21475:137325;1628665:3233937;1628665:29798;162... 1 20131008 29969 78259523 18309305134 50013711 50008168 21458:30992;1628665:29778;1628665:29793;163395... 1 20131008 29970 758305789 20177445814 50018860 28 21458:3602856;1628665:29784;1628665:3233941;73... 1 20131008 29971 rows × 7 columns df.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 29971 entries, 0 to 29970 Data columns (total 7 columns): user_id 29971 non-null object auction_id 29971 non-null int64 cat_id 29971 non-null int64 cat1 29971 non-null int64 property 29827 non-null object buy_mount 29971 non-null int64 day 29971 non-null int64 dtypes: int64(5), object(2) memory usage: 1.6+ MB df.head(10) user_id auction_id cat_id cat1 property buy_mount day 0 786295544 41098319944 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 21896936223 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 3 917056007 12515996043 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 20487688075 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 5 152298847 41840167463 121394024 50008168 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 6 513441334 19909384116 50010557 50008168 25935:21991;1628665:29784;22019:34731;22019:20... 1 20121212 7 297411659 13540124907 50010542 50008168 21458:60020529;25935:31381;1633959:27247291;16... 1 20121212 8 82830661 19948600790 50013874 28 21458:11580;21475:137325 1 20121101 9 475046636 10368360710 203527 28 22724:40168;22729:40278;21458:21817;2770200:24... 1 20121101 df.columns Index(['user_id', 'auction_id', 'cat_id', 'cat1', 'property', 'buy_mount', 'day'], dtype='object') df['user_id'].head() 0 786295544 1 532110457 2 249013725 3 917056007 4 444069173 Name: user_id, dtype: object df[['user_id','cat1']].head() user_id cat1 0 786295544 50022520 1 532110457 28 2 249013725 50014815 3 917056007 50014815 4 444069173 50008168 df[['user_id','cat1']][1:5] user_id cat1 1 532110457 28 2 249013725 50014815 3 917056007 50014815 4 444069173 50008168 df.loc[3:4] user_id auction_id cat_id cat1 property buy_mount day 3 917056007 12515996043 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 20487688075 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 df.loc[:,['user_id','buy_mount']].head(10) user_id buy_mount 0 786295544 2 1 532110457 1 2 249013725 1 3 917056007 2 4 444069173 1 5 152298847 1 6 513441334 1 7 297411659 1 8 82830661 1 9 475046636 1 df.loc[1:3,['user_id','buy_mount']] user_id buy_mount 1 532110457 1 2 249013725 1 3 917056007 2 df.loc[df.user_id == '532110457'] user_id auction_id cat_id cat1 property buy_mount day 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 df.loc[df.user_id == '532110457',['user_id','buy_mount']] user_id buy_mount 1 532110457 1 df.loc[(df.user_id == '532110457') | (df.buy_mount > 300),['user_id','buy_mount']] user_id buy_mount 1 532110457 1 1164 1945590674 1500 5536 2288344467 10000 6241 300205516 600 6627 117730165 2800 9190 462029374 500 10402 32141414 1000 12403 300857121 600 12543 119491758 400 14186 1681976532 340 16213 119395773 700 17821 125495768 410 20490 51409972 306 21482 871858982 350 21989 1671630112 498 25675 173701616 2748 27735 105969610 450 28498 50880819 399 df.iloc[1:3] user_id auction_id cat_id cat1 property buy_mount day 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 21896936223 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 df.iloc[:,1:4] auction_id cat_id cat1 0 41098319944 50014866 50022520 1 17916191097 50011993 28 2 21896936223 50012461 50014815 3 12515996043 50018831 50014815 4 20487688075 50013636 50008168 5 41840167463 121394024 50008168 6 19909384116 50010557 50008168 7 13540124907 50010542 50008168 8 19948600790 50013874 28 9 10368360710 203527 28 10 15307958346 50018202 38 11 21162876126 50012365 122650008 12 15898050723 50013636 50008168 13 15771663914 50015841 28 14 22532727492 50013711 50008168 15 16078389250 50012359 122650008 16 35086271572 50010544 50008168 17 17436967558 50009540 50014815 18 36153356431 50013207 50008168 19 22058239899 50024147 28 20 19171641742 50018860 28 21 38564176352 50013207 50008168 22 8232924597 211122 38 23 17712372914 121434042 50014815 24 35537441586 50006520 50014815 25 15502618744 50010555 50008168 26 26481508332 121412034 50014815 27 40945285800 50012365 122650008 28 35838498718 50012442 50008168 29 27177784760 121394024 50008168 30 40133707057 50010555 50008168 31 42001753405 121394024 50008168 32 41181827319 50012365 122650008 33 39059292616 121452056 50008168 34 15462429573 50007011 50008168 35 14149079479 50023669 28 36 14653740604 50016704 50022520 37 17610665576 50011993 28 38 14228645401 50018824 38 39 39674261411 121466023 50008168 40 40484992676 50011993 28 41 40070019945 50006602 50008168 42 18678458676 50010566 50008168 43 38451267766 121540027 28 44 40519533209 50010544 50008168 45 19063296909 50006235 50008168 46 19051046285 121398041 28 47 14234909614 121470030 50014815 48 20252281923 50013636 50008168 49 18426669796 50018438 50014815 ... ... ... ... 29921 16915013171 50008845 28 29922 10310068684 50012449 50008168 29923 15265710813 50006602 50008168 29924 18836766607 50012788 28 29925 39635136808 50018436 50014815 29926 19704833222 50011993 28 29927 14288242617 50012438 50014815 29928 20959068389 50010544 50008168 29929 37455013590 50023663 28 29930 18220260582 122678023 28 29931 40608095216 50010558 50008168 29932 16684531006 50006095 28 29933 35024165075 50010558 50008168 29934 40599422228 50012428 28 29935 20045810860 50018831 50014815 29936 39339180944 50023591 50022520 29937 40289849863 50013207 50008168 29938 35760225761 50023613 50022520 29939 40798454555 203319 28 29940 35165371283 121394024 50008168 29941 16521677358 50012478 50014815 29942 21129724585 50013207 50008168 29943 18176728510 50013177 28 29944 37844041565 50010555 50008168 29945 42504930457 50012359 122650008 29946 22105131076 50014277 50014815 29947 41666438142 121394024 50008168 29948 13953276547 50012788 28 29949 23375100402 50012451 50008168 29950 17629938386 50023670 28 29951 19739113764 50013636 50008168 29952 37251457564 50012360 122650008 29953 41160643364 121364022 50008168 29954 42298652641 121452056 50008168 29955 36768778465 121448033 38 29956 37200665444 50012361 122650008 29957 36932456353 50010236 50014815 29958 10066997901 50009540 50014815 29959 38019470815 50010236 50014815 29960 19835118833 50003700 28 29961 15842319049 50012479 28 29962 26396292642 50008875 28 29963 10506866020 50007011 50008168 29964 20745380642 50010555 50008168 29965 16563353438 50010544 50008168 29966 35169635909 50010549 50008168 29967 19778523000 50007011 50008168 29968 12766532512 50011993 28 29969 18309305134 50013711 50008168 29970 20177445814 50018860 28 29971 rows × 3 columns df.iloc[[1,10],[0,2]] user_id cat_id 1 532110457 50011993 10 734147966 50018202 #iloc 和 loc df.loc[2:7]#标签 user_id auction_id cat_id cat1 property buy_mount day 2 249013725 21896936223 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 3 917056007 12515996043 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 20487688075 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 5 152298847 41840167463 121394024 50008168 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 6 513441334 19909384116 50010557 50008168 25935:21991;1628665:29784;22019:34731;22019:20... 1 20121212 7 297411659 13540124907 50010542 50008168 21458:60020529;25935:31381;1633959:27247291;16... 1 20121212 df.iloc[2:7]#按照顺序(行) user_id auction_id cat_id cat1 property buy_mount day 2 249013725 21896936223 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 3 917056007 12515996043 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 20487688075 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 5 152298847 41840167463 121394024 50008168 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 6 513441334 19909384116 50010557 50008168 25935:21991;1628665:29784;22019:34731;22019:20... 1 20121212
4.2 数据增加和删除
- 在数据中,直接添加列
- 使用df.insert方法在数据中添加一列
- drop(labels, axis, inplace = True)的用法
- labels表示删除的数据,axis表示作用轴,inplace = True表示对原数据生效
- axis = 0按行操作;axis = 1按列操作
- 使用del函数直接删除其中一列
df.head() user_id auction_id cat_id cat1 property buy_mount day 0 786295544 41098319944 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 21896936223 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 3 917056007 12515996043 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 20487688075 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 df['购买量'] = np.where(df['buy_mount']>3,'高','低') df.head() user_id auction_id cat_id cat1 property buy_mount day 购买量 0 786295544 41098319944 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 低 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 低 2 249013725 21896936223 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 低 3 917056007 12515996043 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 低 4 444069173 20487688075 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 低 auction_id = df['auction_id'] del df['auction_id'] df.insert(0,'auction_id_new',auction_id) df.head() auction_id_new user_id cat_id cat1 property buy_mount day 购买量 0 41098319944 786295544 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 低 1 17916191097 532110457 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 低 2 21896936223 249013725 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 低 3 12515996043 917056007 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 低 4 20487688075 444069173 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 低 pd.set_option('display.max_rows',100)#最多显示100行 df.drop(labels=['auction_id_new','购买量'],axis = 1) user_id cat_id cat1 property buy_mount day 0 786295544 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 3 917056007 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 5 152298847 121394024 50008168 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 6 513441334 50010557 50008168 25935:21991;1628665:29784;22019:34731;22019:20... 1 20121212 7 297411659 50010542 50008168 21458:60020529;25935:31381;1633959:27247291;16... 1 20121212 8 82830661 50013874 28 21458:11580;21475:137325 1 20121101 9 475046636 203527 28 22724:40168;22729:40278;21458:21817;2770200:24... 1 20121101 10 734147966 50018202 38 21458:3270827;7361532:28710594;7397093:7536994... 2 20121101 11 68547330 50012365 122650008 1628665:3233941;1628665:3233942;1628665:323393... 1 20121123 12 697081418 50013636 50008168 21458:19726868;1633959:179425852;13836282:1290... 1 20121123 13 377550424 50015841 28 1628665:3233941;1628665:3233942;3914866:11580;... 1 20121123 14 88313935 50013711 50008168 1628665:3233941;1628665:3233942;22019:3340598;... 1 20131005 15 25918750 50012359 122650008 21458:3405407;1633959:6186201;1628366:32799;81... 1 20131005 16 350288528 50010544 50008168 21458:61813;25935:21991;1628665:3233938;162866... 1 20131129 17 348090113 50009540 50014815 21458:21910;3110425:30696849;2191928:75373546;... 1 20131129 18 1635282280 50013207 50008168 1628665:29784;1628665:29799;2904342:31004;2201... 1 20131129 19 530850018 50024147 28 21458:205007542;43307470:5543413;2339128:62147... 1 20140210 20 749507708 50018860 28 21458:3602856;1628665:3233941;1628665:3233942;... 1 20140210 21 201088567 50013207 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20140502 22 469517728 211122 38 21458:21782;36786:42781029;13023102:6999219;22... 6 20140502 23 691367866 121434042 50014815 21458:49341152;8021059:5525523;6851452:1398669... 1 20140804 24 77193822 50006520 50014815 22277:6262384;21458:30992;1628665:3233941;1628... 2 20140804 25 605678021 50010555 50008168 25935:31381;1628665:3233941;1628665:3233942;16... 1 20130226 26 47702620 121412034 50014815 21458:49341152;11057903:4036007;130475532:7537... 1 20140918 27 763560371 50012365 122650008 21458:30992;1628665:3233939;22007:30338;22007:... 1 20150201 28 408028533 50012442 50008168 21458:3596449;6811831:3446999;13023209:3446999... 1 20141009 29 53566371 121394024 50008168 21458:42090508;1628665:3233941;1628665:3233942... 1 20141009 30 69873877 50010555 50008168 21458:30992;25935:31381;1628665:3233941;162866... 1 20141017 31 1609185254 121394024 50008168 21458:30992;1628665:3233942;1628665:3233936;16... 1 20141228 32 1746148145 50012365 122650008 21458:621749996;13023209:12868;122217803:30916... 1 20141228 33 256475742 121452056 50008168 1628665:29784;1628665:29782;122217801:50793479... 1 20140711 34 405194127 50007011 50008168 21458:35624651;1633959:7320293;1628665:3233941... 1 20120819 35 938309370 50023669 28 21458:4204704;11820090:105550653;11644036:2861... 1 20120819 36 84258337 50016704 50022520 21458:3394654;5261331:4377028;1633959:4377028;... 1 20120819 37 14466144 50011993 28 21458:104000;21475:137325 1 20130327 38 177724549 50018824 38 21475:108284;6933666:96059;33595:16453265;2145... 1 20130327 39 727823869 121466023 50008168 21458:14332755;1628665:3233941;1628665:3233942... 2 20140813 40 659020106 50011993 28 21458:16162126;13023209:10551667;122218042:605... 1 20140813 41 46277938 50006602 50008168 21458:29563;10984217:21985;13023209:3488197;21... 1 20140813 42 827091396 50010566 50008168 21458:46906;13023209:158751187;25935:21991;320... 1 20140911 43 18100946 121540027 28 21458:215485914;125501489:19689726;11945782:78... 1 20140911 44 725813399 50010544 50008168 21458:32270;13023209:669513679;25935:21991;162... 1 20140911 45 1054852159 50006235 50008168 1628665:3233941;21475:17106236;21475:17106365;... 2 20140703 46 262519726 121398041 28 11666049:40203;21458:3961150;17472269:13302841... 1 20140703 47 87207277 121470030 50014815 21458:30992;1628665:3233941;1628665:3233942;16... 1 20140703 48 1053602675 50013636 50008168 21458:216724052;1628665:29798;1628665:29796;25... 1 20140220 49 103125167 50018438 50014815 21458:46896;1628665:3233941;1628665:3233942;21... 16 20140220 ... ... ... ... ... ... ... 29921 1372572 50008845 28 21458:30992;1628665:3233941;1628665:3233942;16... 1 20130327 29922 646265934 50012449 50008168 21458:70899896;8539985:3374457;1633959:3374457... 1 20130823 29923 184923046 50006602 50008168 30497:46157;30498:46160;1628665:3233941;162866... 1 20130823 29924 167288532 50012788 28 2112993:29274;122277833:104377;1628665:3233941... 1 20140913 29925 54855720 50018436 50014815 1628665:3233941;1628665:3233942;1628665:323393... 2 20140913 29926 2183330808 50011993 28 21458:119679150;13023209:4067094;122218042:216... 1 20140913 29927 372911996 50012438 50014815 21458:8535341;1628665:3233941;5970350:3402020;... 1 20121222 29928 22414724 50010544 50008168 21458:61834;25935:21990;1628665:3233941;162866... 1 20121222 29929 113446171 50023663 28 11760865:6120557;21458:3314841;122277597:2054;... 1 20140831 29930 522850986 122678023 28 21458:91312408;138253785:653822445;135925585:1... 1 20140831 29931 671912471 50010558 50008168 25935:21991;1628665:3233942;1628665:3233938;12... 1 20140831 29932 2212582093 50006095 28 21458:3532516;8088680:4482698;1628665:3233941;... 1 20150205 29933 712130383 50010558 50008168 21458:30992;25935:31381;1628665:29799;12221780... 1 20150205 29934 326432534 50012428 28 1628665:3233941;1628665:29790;1628665:3233936;... 1 20150110 29935 1663431626 50018831 50014815 21458:3630550;7255245:3630549;27174406:1782825... 2 20150110 29936 1041477880 50023591 50022520 1628665:29790;1628665:29778;1628665:3233938;16... 1 20140710 29937 2078287226 50013207 50008168 21458:100854706;13023209:647423831;22121:11712... 1 20141029 29938 22270319 50023613 50022520 NaN 1 20141029 29939 2074613684 203319 28 122217795:29277;134943792:29774;134943792:2977... 1 20141108 29940 1048135914 121394024 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20141108 29941 413188001 50012478 50014815 21458:28155;5434803:3636603;2815901:22583732;1... 1 20130107 29942 474062095 50013207 50008168 21458:21599;1628665:29798;1628665:3233938;1628... 1 20130107 29943 797710454 50013177 28 1628665:3233941;1628665:3233942;1628665:323393... 1 20130107 29944 1716505453 50010555 50008168 21458:30992;25935:31381;1628665:3233941;162866... 1 20141231 29945 1966692323 50012359 122650008 21458:3379652;1628665:3233940;1628665:3233938;... 1 20141231 29946 641734831 50014277 50014815 21458:21906;13227811:51479;13230966:75369014;3... 2 20141016 29947 731030177 121394024 50008168 21458:3443560;1628665:3233942;1628665:3233938;... 1 20141016 29948 68515755 50012788 28 21458:12376977;2112993:32075;1628665:92012;162... 1 20130729 29949 180436843 50012451 50008168 21458:33514;1633959:13343071;33030:29800;33162... 1 20130729 29950 801784345 50023670 28 21458:3550980;29154281:231350353;11684888:1045... 1 20130729 29951 124458824 50013636 50008168 21458:30992;13658074:9306734;1628665:3233941;1... 1 20140322 29952 602141957 50012360 122650008 21458:21599;1628665:29798;1628665:82340;162866... 1 20140322 29953 595095853 121364022 50008168 21458:80090256;1628665:29784;1628665:29796;162... 1 20150111 29954 1905258237 121452056 50008168 21458:30992;1628665:3233942;1628665:31614;1628... 1 20150111 29955 1957645413 121448033 38 6940834:29865;1628149:137593;21475:114226;2275... 1 20140815 29956 1854778218 50012361 122650008 21458:3645338;13023209:544768204;122217803:309... 1 20140815 29957 268356658 50010236 50014815 21458:10513072;12474507:706291650;3091143:9208... 1 20141027 29958 196272909 50009540 50014815 21458:21906;13229910:32056435;2191928:73664723... 1 20141104 29959 23473499 50010236 50014815 1628665:61550;1628665:3233940;1628665:3233936;... 1 20141104 29960 816394377 50003700 28 24448:73774385;6725953:48332;22044:30715;80047... 1 20130912 29961 164859586 50012479 28 NaN 1 20130912 29962 119149466 50008875 28 21458:30992;11684888:104528258;21475:11488282;... 1 20130912 29963 704655047 50007011 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20121206 29964 45662429 50010555 50008168 25935:31381;1628665:3233941;1628665:3233942;16... 1 20121206 29965 35711492 50010544 50008168 21458:11580;25935:21991;1628665:92012;1628665:... 1 20121206 29966 57747284 50010549 50008168 21458:125202070;22019:3228688;22019:3248884;22... 1 20140109 29967 287541325 50007011 50008168 21458:112788583;1633959:3523439;3130834:209537... 2 20140109 29968 82915321 50011993 28 21475:137325;1628665:3233937;1628665:29798;162... 1 20131008 29969 78259523 50013711 50008168 21458:30992;1628665:29778;1628665:29793;163395... 1 20131008 29970 758305789 50018860 28 21458:3602856;1628665:29784;1628665:3233941;73... 1 20131008 29971 rows × 6 columns df.head()#发现刚才删除的两列数据还是在 auction_id_new user_id cat_id cat1 property buy_mount day 购买量 0 41098319944 786295544 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 低 1 17916191097 532110457 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 低 2 21896936223 249013725 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 低 3 12515996043 917056007 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 低 4 20487688075 444069173 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 低 df.drop(labels=['auction_id_new','购买量'],axis = 1, inplace = True)#替换原数据,使数据生效 df.head() user_id cat_id cat1 property buy_mount day 0 786295544 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 3 917056007 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 df.drop(labels=[3,4], axis = 0, inplace = True)#删除行标签3,4;axis默认为0 df.head() user_id cat_id cat1 property buy_mount day 0 786295544 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 5 152298847 121394024 50008168 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 6 513441334 50010557 50008168 25935:21991;1628665:29784;22019:34731;22019:20... 1 20121212 df.drop(labels=range(6,11),axis=0,inplace = True) df.head() user_id cat_id cat1 property buy_mount day 0 786295544 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 5 152298847 121394024 50008168 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 11 68547330 50012365 122650008 1628665:3233941;1628665:3233942;1628665:323393... 1 20121123
4.3 数据修改和查找
- 在数据中,可以使用rename修改列名称或者行索引名称
- 使用loc方法修改数据
- 使用loc方法查找符合条件的数据
- 条件和条件之间用&或者|连接,分别代表‘且’ 和‘或’
- 使用between和isin选择满足条件的行
import pandas as pd import os os.chdir('D:\code\jupyter\course\代码和数据') df1 = pd.read_csv('sam_tianchi_mum_baby.csv',encoding = 'utf-8', dtype = str) df1.head() user_id birthday gender 0 2757 20130311 1 1 415971 20121111 0 2 1372572 20120130 1 3 10339332 20110910 0 4 10642245 20130213 0 df1.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 953 entries, 0 to 952 Data columns (total 3 columns): user_id 953 non-null object birthday 953 non-null object gender 953 non-null object dtypes: object(3) memory usage: 22.4+ KB df1.loc[df1['gender']=='0','gender'] = '女性' df1.loc[df1['gender'] == '1', 'gender'] = '男性' df1.loc[df1['gender'] == '2', 'gender'] = '未知' df1.head(10) user_id birthday gender 0 2757 20130311 男性 1 415971 20121111 女性 2 1372572 20120130 男性 3 10339332 20110910 女性 4 10642245 20130213 女性 5 10923201 20110830 男性 6 11768880 20120107 男性 7 12519465 20130705 男性 8 12950574 20090708 女性 9 13735440 20120323 女性 df1.rename(columns={'user_id':'用户ID','birthday':'出生日期','gender':'性别'},inplace = True) df1.head() 用户ID 出生日期 性别 0 2757 20130311 男性 1 415971 20121111 女性 2 1372572 20120130 男性 3 10339332 20110910 女性 4 10642245 20130213 女性 df1.rename(index = {3:3555,4:6789}, inplace = True) df1.head() 用户ID 出生日期 性别 0 2757 20130311 男性 1 415971 20121111 女性 2 1372572 20120130 男性 3555 10339332 20110910 女性 6789 10642245 20130213 女性 df1.iloc[:5] 用户ID 出生日期 性别 0 2757 20130311 男性 1 415971 20121111 女性 2 1372572 20120130 男性 3555 10339332 20110910 女性 6789 10642245 20130213 女性 df1.reset_index(drop = True, inplace = True)#drop = True丢弃原索引 df1 用户ID 出生日期 性别 0 2757 20130311 男性 1 415971 20121111 女性 2 1372572 20120130 男性 3 10339332 20110910 女性 4 10642245 20130213 女性 5 10923201 20110830 男性 6 11768880 20120107 男性 7 12519465 20130705 男性 8 12950574 20090708 女性 9 13735440 20120323 女性 10 14510892 20140812 男性 11 14905422 20110429 男性 12 15786531 20080922 女性 13 16265490 20091209 女性 14 17431245 20110115 女性 15 18190851 20110101 女性 16 20087991 20100808 女性 17 20570454 20081017 男性 18 21137271 20110204 男性 19 21415917 20060801 男性 20 21887268 20100526 女性 21 22602471 20090601 男性 22 23208537 20080416 男性 23 23927133 20081029 女性 24 24829944 20140826 男性 25 25807593 20141122 男性 26 26629842 20131124 女性 27 27213666 20080413 女性 28 30595206 20070918 女性 29 31235454 20110319 女性 ... ... ... ... 923 1063363684 20141114 女性 924 1070284684 20111229 女性 925 1081311286 20131031 女性 926 1087643545 20130629 男性 927 1094274418 20130803 女性 928 1103802043 20130301 男性 929 1133628211 20120903 女性 930 1577585731 20130321 女性 931 1609674769 20140703 未知 932 1635254677 20130123 男性 933 1649930323 20101004 女性 934 1671493753 20141222 男性 935 1683328510 20130817 男性 936 1702276954 20130821 男性 937 1711109878 20120823 女性 938 1720825303 20140721 女性 939 1754594929 20140826 女性 940 1812586633 20150309 女性 941 1830529477 20130617 女性 942 1836568285 20111123 女性 943 1862594497 20100105 女性 944 1890948217 20130917 女性 945 1921509424 20130531 男性 946 1973092345 20030303 女性 947 1993235563 20140709 男性 948 2020957900 20140430 女性 949 2080304899 20100713 女性 950 2114469016 20140416 女性 951 2186831536 20140519 男性 952 2254611367 20111031 女性 953 rows × 3 columns # del df1['index'] df = pd.read_csv('baby_trade_history.csv',encoding = 'utf-8',dtype = {'user_id':str}) df.head(2) user_id auction_id cat_id cat1 property buy_mount day 0 786295544 41098319944 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 df['buy_mount']>10#返回布尔值索引 0 False 1 False 2 False 3 False 4 False 5 False 6 False 7 False 8 False 9 False 10 False 11 False 12 False 13 False 14 False 15 False 16 False 17 False 18 False 19 False 20 False 21 False 22 False 23 False 24 False 25 False 26 False 27 False 28 False 29 False ... 29941 False 29942 False 29943 False 29944 False 29945 False 29946 False 29947 False 29948 False 29949 False 29950 False 29951 False 29952 False 29953 False 29954 False 29955 False 29956 False 29957 False 29958 False 29959 False 29960 False 29961 False 29962 False 29963 False 29964 False 29965 False 29966 False 29967 False 29968 False 29969 False 29970 False Name: buy_mount, Length: 29971, dtype: bool df[df['buy_mount']>10]#把True的行筛选出来 user_id auction_id cat_id cat1 property buy_mount day 49 103125167 18426669796 50018438 50014815 21458:46896;1628665:3233941;1628665:3233942;21... 16 20140220 65 605724983 19747694834 50006520 50014815 21458:30992 12 20141017 89 277279277 18024521052 211122 38 21458:33516;33480:3238774;2653417:7353464;3359... 12 20130513 247 392530596 17001611735 50011993 28 122218042:50276;21475:135183931;1628861:45151;... 101 20140301 409 1968453717 12567034563 122616024 28 135925585:42825;138052423:142000990;18822961:2... 14 20150127 462 1802549062 17383345857 50006520 50014815 22277:6262384;21458:30992;1628665:61550;162866... 11 20141120 579 67966573 15305777299 50005987 50014815 21458:30992;1628665:3233942;1628665:92012;1628... 40 20130320 758 1016329408 15423234164 50014863 50014815 21458:140976748;1633959:3399471 20 20131014 768 398577904 10380868910 50006521 50014815 21458:7480167;1633959:113175440;2815901:113175440 14 20130328 774 285754654 37855020323 50007011 50008168 1628665:3233941;1628665:3233942;122217637:4218... 14 20141021 839 1057202563 20316214076 50018831 50014815 21458:5796421;27113886:21671;1828184:21671;123... 100 20141228 881 788180557 3903931529 50012456 50014815 21458:8788840;1628665:3233941;1628665:3233938;... 15 20131221 894 924233976 6056704335 211122 38 21458:21771;25843:13069216;2798747:75369399;69... 30 20140818 921 854075302 12858202787 50006843 38 21458:21777;1973644:10423084;3939833:59811;281... 36 20121108 994 396556115 2611077985 50016030 50008168 21458:144134471;1628665:3233942;1628665:31614;... 12 20121207 1041 631100146 42294961374 211122 38 21458:3856301;1693457:67512411;6933553:4099393... 12 20141223 1164 1945590674 3920805463 50011993 28 122218042:50276;21475:135183931;1628861:21671;... 1500 20150112 1223 424964507 16471850052 211122 38 21458:3516716;1663452:141726288;6933553:397177... 12 20140823 1367 458001387 10064842331 50012564 50014815 21458:6144095;2219776:11530560;27493874:28896;... 12 20130312 1376 673071811 26442940080 50003700 28 21458:62138;24448:41375853;6725953:48332;22044... 50 20130806 1495 1582690452 37501598507 50002524 28 21458:17093736;127511910:3235337;122217831:216... 22 20141203 1817 140357824 13065090943 50007013 50008168 1628665:3233942;1628665:29790;1628665:3233936;... 12 20121207 1935 1027001463 38255171696 121364033 28 1628665:3233941;1628665:3233942;1628665:323393... 11 20140731 2162 289874368 15001772187 50013839 28 21458:7042187;1633959:3502139;1627584:28619;21... 50 20120911 2201 182436006 13493868283 211122 38 21458:138742;36816:141627536;6933553:3313377;1... 11 20130817 2379 305375596 19103595732 50016010 28 21458:26321909;29367653:193254414;3989588:3128... 15 20130816 2475 1590098901 10225357378 50012564 50014815 1628149:48509498;15054114:9609256;8456532:4775... 20 20150104 2521 697770978 36772151215 50011993 28 21475:137325;1628665:3233942;1628665:92012;162... 15 20140218 2544 833074572 16460064908 50012474 28 1628665:3233941;1628665:3233942;21475:135183931 100 20141115 2655 2054871149 40153522517 50007140 28 21458:633981966;137412302:6136158;21475:135183... 20 20140903 ... ... ... ... ... ... ... ... 28131 811357540 21358487569 50009548 50014815 21458:30992;21479:104453110 11 20130916 28254 38885906 27145516358 50016034 28 1628665:3233941;1628665:29790;1628665:3233936 25 20140331 28280 638570366 42144698158 50016006 28 122218036:21671;3139975:3283201;11684888:11468 21 20141117 28367 759885586 20938923820 211122 38 21458:21774;33484:12998940;3205219:75369949;69... 12 20141025 28420 690620202 17663742912 50012474 28 32959:92607433;21479:21671;11684888:11468;2147... 100 20140514 28476 14324911 14513750479 50024439 28 1628665:3233941;1628665:29790;1628665:3233936;... 200 20140601 28498 50880819 21948251334 50006235 50008168 21458:46911;2397831:40203 399 20140809 28545 37808587 14826167599 50016010 28 1628665:3233941;6796859:52368;6796859:52367;67... 22 20130217 28556 779331320 16183759869 50012424 28 1628665:3233939;1628665:92012;1628665:31614;16... 50 20131130 28571 1849194665 38364331602 121426030 28 21475:275708185 20 20150116 28606 23821747 12901779366 50016010 28 NaN 100 20120914 28810 707345225 15532343360 50012456 50014815 21458:46896;1628665:131622 20 20121007 28856 1029711489 20514824523 50006026 50022520 21458:21422323 15 20141111 28942 397372394 36636836394 50018830 38 122218363:21851;21458:14370739;9908991:9320002... 11 20140723 28995 299196791 38217159047 50013187 28 1628665:3233941;1628665:3233942;1628665:323393... 26 20140521 29014 96977512 21572028903 50008177 28 NaN 159 20131101 29070 476163140 21508904661 50013187 28 1628665:29784;1628665:3233941;1628665:3233942;... 35 20131106 29107 1048801281 14045002761 50014250 28 1627584:28619;11684888:104528258 20 20121231 29125 417272733 22253615762 50006602 50008168 21458:3234453;10984217:21985;13023209:109239;2... 18 20140407 29141 1039673872 38374051529 50012442 50008168 1628665:29793;1628665:29796;1628665:108579;220... 14 20140516 29169 1992006058 35100624394 50006602 50008168 10984217:21671;21479:21671;1628665:3233939;162... 15 20140515 29610 695386236 18007575656 50013187 28 21458:126213215;14729701:3533493;1628665:32339... 80 20130818 29670 348287849 12444398662 50002524 28 21458:21599;22914:43278 50 20120830 29693 665606447 12831795335 50006602 50008168 30497:46155;30498:46160;1628665:3233936;162866... 60 20130828 29710 665247829 17752245791 50002524 28 21458:30992;122217831:30096;22917:43294;162866... 84 20140713 29717 709084494 15817489563 50016063 28 21458:13497331;4000293:40886357;11684888:10452... 50 20120906 29797 205209101 15758698533 50026474 50022520 21458:33970;34862:119673;33595:28869;6933666:9... 100 20130606 29836 390674837 19633279452 50011993 28 21458:232320037;1633959:3794542;1628862:50276;... 20 20130628 29864 1583062677 35887382877 50013187 28 21458:3435452;2932904:33025434;1628665:3233942... 26 20140801 29872 679730887 2976950254 211122 38 21458:21786;33482:3308368;6492430:75369949;693... 12 20140418 382 rows × 7 columns df[~(df['buy_mount']>10)]# ~取相反 user_id auction_id cat_id cat1 property buy_mount day 0 786295544 41098319944 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 21896936223 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 3 917056007 12515996043 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 20487688075 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 5 152298847 41840167463 121394024 50008168 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 6 513441334 19909384116 50010557 50008168 25935:21991;1628665:29784;22019:34731;22019:20... 1 20121212 7 297411659 13540124907 50010542 50008168 21458:60020529;25935:31381;1633959:27247291;16... 1 20121212 8 82830661 19948600790 50013874 28 21458:11580;21475:137325 1 20121101 9 475046636 10368360710 203527 28 22724:40168;22729:40278;21458:21817;2770200:24... 1 20121101 10 734147966 15307958346 50018202 38 21458:3270827;7361532:28710594;7397093:7536994... 2 20121101 11 68547330 21162876126 50012365 122650008 1628665:3233941;1628665:3233942;1628665:323393... 1 20121123 12 697081418 15898050723 50013636 50008168 21458:19726868;1633959:179425852;13836282:1290... 1 20121123 13 377550424 15771663914 50015841 28 1628665:3233941;1628665:3233942;3914866:11580;... 1 20121123 14 88313935 22532727492 50013711 50008168 1628665:3233941;1628665:3233942;22019:3340598;... 1 20131005 15 25918750 16078389250 50012359 122650008 21458:3405407;1633959:6186201;1628366:32799;81... 1 20131005 16 350288528 35086271572 50010544 50008168 21458:61813;25935:21991;1628665:3233938;162866... 1 20131129 17 348090113 17436967558 50009540 50014815 21458:21910;3110425:30696849;2191928:75373546;... 1 20131129 18 1635282280 36153356431 50013207 50008168 1628665:29784;1628665:29799;2904342:31004;2201... 1 20131129 19 530850018 22058239899 50024147 28 21458:205007542;43307470:5543413;2339128:62147... 1 20140210 20 749507708 19171641742 50018860 28 21458:3602856;1628665:3233941;1628665:3233942;... 1 20140210 21 201088567 38564176352 50013207 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20140502 22 469517728 8232924597 211122 38 21458:21782;36786:42781029;13023102:6999219;22... 6 20140502 23 691367866 17712372914 121434042 50014815 21458:49341152;8021059:5525523;6851452:1398669... 1 20140804 24 77193822 35537441586 50006520 50014815 22277:6262384;21458:30992;1628665:3233941;1628... 2 20140804 25 605678021 15502618744 50010555 50008168 25935:31381;1628665:3233941;1628665:3233942;16... 1 20130226 26 47702620 26481508332 121412034 50014815 21458:49341152;11057903:4036007;130475532:7537... 1 20140918 27 763560371 40945285800 50012365 122650008 21458:30992;1628665:3233939;22007:30338;22007:... 1 20150201 28 408028533 35838498718 50012442 50008168 21458:3596449;6811831:3446999;13023209:3446999... 1 20141009 29 53566371 27177784760 121394024 50008168 21458:42090508;1628665:3233941;1628665:3233942... 1 20141009 ... ... ... ... ... ... ... ... 29941 413188001 16521677358 50012478 50014815 21458:28155;5434803:3636603;2815901:22583732;1... 1 20130107 29942 474062095 21129724585 50013207 50008168 21458:21599;1628665:29798;1628665:3233938;1628... 1 20130107 29943 797710454 18176728510 50013177 28 1628665:3233941;1628665:3233942;1628665:323393... 1 20130107 29944 1716505453 37844041565 50010555 50008168 21458:30992;25935:31381;1628665:3233941;162866... 1 20141231 29945 1966692323 42504930457 50012359 122650008 21458:3379652;1628665:3233940;1628665:3233938;... 1 20141231 29946 641734831 22105131076 50014277 50014815 21458:21906;13227811:51479;13230966:75369014;3... 2 20141016 29947 731030177 41666438142 121394024 50008168 21458:3443560;1628665:3233942;1628665:3233938;... 1 20141016 29948 68515755 13953276547 50012788 28 21458:12376977;2112993:32075;1628665:92012;162... 1 20130729 29949 180436843 23375100402 50012451 50008168 21458:33514;1633959:13343071;33030:29800;33162... 1 20130729 29950 801784345 17629938386 50023670 28 21458:3550980;29154281:231350353;11684888:1045... 1 20130729 29951 124458824 19739113764 50013636 50008168 21458:30992;13658074:9306734;1628665:3233941;1... 1 20140322 29952 602141957 37251457564 50012360 122650008 21458:21599;1628665:29798;1628665:82340;162866... 1 20140322 29953 595095853 41160643364 121364022 50008168 21458:80090256;1628665:29784;1628665:29796;162... 1 20150111 29954 1905258237 42298652641 121452056 50008168 21458:30992;1628665:3233942;1628665:31614;1628... 1 20150111 29955 1957645413 36768778465 121448033 38 6940834:29865;1628149:137593;21475:114226;2275... 1 20140815 29956 1854778218 37200665444 50012361 122650008 21458:3645338;13023209:544768204;122217803:309... 1 20140815 29957 268356658 36932456353 50010236 50014815 21458:10513072;12474507:706291650;3091143:9208... 1 20141027 29958 196272909 10066997901 50009540 50014815 21458:21906;13229910:32056435;2191928:73664723... 1 20141104 29959 23473499 38019470815 50010236 50014815 1628665:61550;1628665:3233940;1628665:3233936;... 1 20141104 29960 816394377 19835118833 50003700 28 24448:73774385;6725953:48332;22044:30715;80047... 1 20130912 29961 164859586 15842319049 50012479 28 NaN 1 20130912 29962 119149466 26396292642 50008875 28 21458:30992;11684888:104528258;21475:11488282;... 1 20130912 29963 704655047 10506866020 50007011 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20121206 29964 45662429 20745380642 50010555 50008168 25935:31381;1628665:3233941;1628665:3233942;16... 1 20121206 29965 35711492 16563353438 50010544 50008168 21458:11580;25935:21991;1628665:92012;1628665:... 1 20121206 29966 57747284 35169635909 50010549 50008168 21458:125202070;22019:3228688;22019:3248884;22... 1 20140109 29967 287541325 19778523000 50007011 50008168 21458:112788583;1633959:3523439;3130834:209537... 2 20140109 29968 82915321 12766532512 50011993 28 21475:137325;1628665:3233937;1628665:29798;162... 1 20131008 29969 78259523 18309305134 50013711 50008168 21458:30992;1628665:29778;1628665:29793;163395... 1 20131008 29970 758305789 20177445814 50018860 28 21458:3602856;1628665:29784;1628665:3233941;73... 1 20131008 29589 rows × 7 columns df[(df['buy_mount']>10) & (df['day']>20141104)] user_id auction_id cat_id cat1 property buy_mount day 409 1968453717 12567034563 122616024 28 135925585:42825;138052423:142000990;18822961:2... 14 20150127 462 1802549062 17383345857 50006520 50014815 22277:6262384;21458:30992;1628665:61550;162866... 11 20141120 839 1057202563 20316214076 50018831 50014815 21458:5796421;27113886:21671;1828184:21671;123... 100 20141228 1041 631100146 42294961374 211122 38 21458:3856301;1693457:67512411;6933553:4099393... 12 20141223 1164 1945590674 3920805463 50011993 28 122218042:50276;21475:135183931;1628861:21671;... 1500 20150112 1495 1582690452 37501598507 50002524 28 21458:17093736;127511910:3235337;122217831:216... 22 20141203 2475 1590098901 10225357378 50012564 50014815 1628149:48509498;15054114:9609256;8456532:4775... 20 20150104 2544 833074572 16460064908 50012474 28 1628665:3233941;1628665:3233942;21475:135183931 100 20141115 2874 1894938964 42283452988 50016006 28 122218036:21671;3139975:21671 133 20141111 3227 1095450810 37167214970 50018831 50014815 21458:3223239;7255174:213426014;34141926:15180... 35 20150128 3477 611558482 20316890083 50016116 38 21458:14101308;4856593:3372087;135451994:33223... 100 20141126 4145 100214342 13513882535 50023531 28 1628665:3233941;1628665:3233942;1628665:323393... 30 20150116 4699 21486980 18829284960 252819 28 21475:135183931;1628665:3233941;1628665:29790;... 28 20141224 4880 641771856 40455936479 50011993 28 13023209:75859864;122218042:3251285;21475:1351... 25 20150129 5536 2288344467 39769942518 50018831 50014815 21458:30992;23378:21671;123923464:29774;25935:... 10000 20141113 5664 444642868 42230753719 121462075 50008168 21458:147731076;13023209:3328805;25935:31381;1... 11 20141114 6133 537884755 17890734292 50024076 28 11684888:11468;1628665:3233941;1628665:29790;2... 15 20150203 6301 2356452983 42156837465 50016006 28 122218036:21671;3139975:3245332 148 20141206 6538 2080751557 41264999009 211122 38 21458:11670881;2077571:3482017;2672446:3329357... 12 20141229 6802 558778114 36822692939 211122 38 21458:21782;36786:42781029;6933553:20337137;13... 96 20150204 6875 52992953 36554856332 50016006 28 122218036:28949;1628665:3233941;1628665:323394... 95 20141126 7126 25944466 20000450897 50024148 28 1628665:3233941;21479:28619;122218092:43179;21... 100 20150102 7655 2053324445 23072796101 50018831 50014815 21458:3978733;7255183:104591;7255240:10062130;... 11 20141208 8033 1989767813 22161075761 50018831 50014815 122217774:28890;21458:30992;23378:21671;123923... 100 20141111 9026 21341330 13388168847 50023663 28 11760865:4319809;21458:86666282;1628665:323394... 12 20141203 10789 418019618 6979881857 50011993 28 122218042:50271;21475:135183931;1628861:325125... 20 20141231 11151 2259132053 42283452988 50016006 28 122218036:21671;3139975:21671 29 20141119 11507 55181850 41734316251 50016010 28 1628665:3233941;1628665:3233942;1628665:323393... 37 20141218 11941 289514800 35858376285 211122 38 21458:21772;25158:109420945;6933553:4099393;45... 15 20141208 12324 1086263294 9768192441 50009540 50014815 1628665:3233941;21458:21900;3097740:31176944;2... 24 20141111 12812 1097746473 39207030864 211122 38 21458:139345;1637630:3352859;2583260:75369949;... 15 20141231 12834 648097714 42156837465 50016006 28 122218036:21671;3139975:3245332 26 20141208 13216 153250940 41052736468 50023670 28 21458:3482061;1628665:29782;21475:135183931;29... 30 20150120 14142 144104584 40457079374 50008704 28 21475:135183931;21479:28619;32959:107150583;11... 30 20141229 14878 1714377275 38237179370 50013187 28 1628665:3233941;1628665:3233942;1628665:323393... 40 20150131 15505 49200319 38220750533 50000820 28 1628665:3233941;1628665:3233942;1628665:323393... 28 20150128 16016 675975714 42851595705 50011993 28 122218042:3241136;21475:135183931;32959:104027... 100 20150125 16128 296753414 39740255999 50002524 28 21458:30992;122217831:43523;22936:43526;162866... 11 20150125 16485 886228200 40526941841 211122 38 21458:21776;36780:132022678;6933553:3313377;15... 12 20150114 16814 764709065 4745831250 50011993 28 122218042:50276;21475:385579823;1628861:21671;... 70 20150205 17464 2266720832 39260479308 50011993 28 21458:612982335;13023209:3238342;122218042:502... 14 20141219 18089 99442980 40250113589 50132020 122650008 122217803:30916;124129949:21671;122218021:1357... 20 20141201 18545 85350886 42129750183 50013187 28 1628665:61550;1628665:3233940;1628665:3233938;... 50 20141227 19179 1100309142 36484861024 211122 38 21458:21786;33482:12586385;2804159:75369949;69... 12 20150202 20172 320363606 37762776191 50012788 28 1628665:3233941;1628665:3233942;1628665:323393... 15 20141225 21755 1756069759 37630514684 122616024 28 135925585:67847851;138020445:4260858;3139975:3... 151 20141122 21973 52281705 40915526518 50016010 28 21458:641000140;1628665:3233941;1628665:323394... 13 20141201 22375 1076476925 40968823284 251725 28 1628665:3233941;1628665:3233942;21475:38557982... 25 20150118 22767 48952635 17951330294 50016039 28 21458:3275674;1628665:3233941;1628665:3233942;... 38 20150107 22837 321893084 35038828990 211122 38 21458:3270818;1661547:141725965;6933553:224228... 12 20150108 22873 1039302275 43415805725 50018202 38 21458:132340;6933553:3313377;7069933:3253542;7... 20 20150203 24007 59398317 37558756949 121434042 50014815 6851452:11580;21458:4419247 36 20150126 25308 418523685 15849872107 50018824 38 6940834:29865;21458:6383499;21475:114227;16281... 20 20150130 25829 122173155 27486712532 211122 38 21458:3270826;1822010:141726289;6933553:326368... 12 20141207 26305 55944490 26610632966 50012244 50014815 122218005:119508;21458:7209537;1628665:3233942... 30 20141122 27451 747399886 19211968695 50013207 50008168 21458:30992;1628665:3233941;1628665:3233942;16... 38 20150101 28280 638570366 42144698158 50016006 28 122218036:21671;3139975:3283201;11684888:11468 21 20141117 28571 1849194665 38364331602 121426030 28 21475:275708185 20 20150116 28856 1029711489 20514824523 50006026 50022520 21458:21422323 15 20141111 df[df['buy_mount'].between(1,10,inclusive = True)]#inclusive表示包括两端 user_id auction_id cat_id cat1 property buy_mount day 0 786295544 41098319944 50014866 50022520 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 2 249013725 21896936223 50012461 50014815 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 3 917056007 12515996043 50018831 50014815 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 4 444069173 20487688075 50013636 50008168 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 5 152298847 41840167463 121394024 50008168 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 6 513441334 19909384116 50010557 50008168 25935:21991;1628665:29784;22019:34731;22019:20... 1 20121212 7 297411659 13540124907 50010542 50008168 21458:60020529;25935:31381;1633959:27247291;16... 1 20121212 8 82830661 19948600790 50013874 28 21458:11580;21475:137325 1 20121101 9 475046636 10368360710 203527 28 22724:40168;22729:40278;21458:21817;2770200:24... 1 20121101 10 734147966 15307958346 50018202 38 21458:3270827;7361532:28710594;7397093:7536994... 2 20121101 11 68547330 21162876126 50012365 122650008 1628665:3233941;1628665:3233942;1628665:323393... 1 20121123 12 697081418 15898050723 50013636 50008168 21458:19726868;1633959:179425852;13836282:1290... 1 20121123 13 377550424 15771663914 50015841 28 1628665:3233941;1628665:3233942;3914866:11580;... 1 20121123 14 88313935 22532727492 50013711 50008168 1628665:3233941;1628665:3233942;22019:3340598;... 1 20131005 15 25918750 16078389250 50012359 122650008 21458:3405407;1633959:6186201;1628366:32799;81... 1 20131005 16 350288528 35086271572 50010544 50008168 21458:61813;25935:21991;1628665:3233938;162866... 1 20131129 17 348090113 17436967558 50009540 50014815 21458:21910;3110425:30696849;2191928:75373546;... 1 20131129 18 1635282280 36153356431 50013207 50008168 1628665:29784;1628665:29799;2904342:31004;2201... 1 20131129 19 530850018 22058239899 50024147 28 21458:205007542;43307470:5543413;2339128:62147... 1 20140210 20 749507708 19171641742 50018860 28 21458:3602856;1628665:3233941;1628665:3233942;... 1 20140210 21 201088567 38564176352 50013207 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20140502 22 469517728 8232924597 211122 38 21458:21782;36786:42781029;13023102:6999219;22... 6 20140502 23 691367866 17712372914 121434042 50014815 21458:49341152;8021059:5525523;6851452:1398669... 1 20140804 24 77193822 35537441586 50006520 50014815 22277:6262384;21458:30992;1628665:3233941;1628... 2 20140804 25 605678021 15502618744 50010555 50008168 25935:31381;1628665:3233941;1628665:3233942;16... 1 20130226 26 47702620 26481508332 121412034 50014815 21458:49341152;11057903:4036007;130475532:7537... 1 20140918 27 763560371 40945285800 50012365 122650008 21458:30992;1628665:3233939;22007:30338;22007:... 1 20150201 28 408028533 35838498718 50012442 50008168 21458:3596449;6811831:3446999;13023209:3446999... 1 20141009 29 53566371 27177784760 121394024 50008168 21458:42090508;1628665:3233941;1628665:3233942... 1 20141009 ... ... ... ... ... ... ... ... 29941 413188001 16521677358 50012478 50014815 21458:28155;5434803:3636603;2815901:22583732;1... 1 20130107 29942 474062095 21129724585 50013207 50008168 21458:21599;1628665:29798;1628665:3233938;1628... 1 20130107 29943 797710454 18176728510 50013177 28 1628665:3233941;1628665:3233942;1628665:323393... 1 20130107 29944 1716505453 37844041565 50010555 50008168 21458:30992;25935:31381;1628665:3233941;162866... 1 20141231 29945 1966692323 42504930457 50012359 122650008 21458:3379652;1628665:3233940;1628665:3233938;... 1 20141231 29946 641734831 22105131076 50014277 50014815 21458:21906;13227811:51479;13230966:75369014;3... 2 20141016 29947 731030177 41666438142 121394024 50008168 21458:3443560;1628665:3233942;1628665:3233938;... 1 20141016 29948 68515755 13953276547 50012788 28 21458:12376977;2112993:32075;1628665:92012;162... 1 20130729 29949 180436843 23375100402 50012451 50008168 21458:33514;1633959:13343071;33030:29800;33162... 1 20130729 29950 801784345 17629938386 50023670 28 21458:3550980;29154281:231350353;11684888:1045... 1 20130729 29951 124458824 19739113764 50013636 50008168 21458:30992;13658074:9306734;1628665:3233941;1... 1 20140322 29952 602141957 37251457564 50012360 122650008 21458:21599;1628665:29798;1628665:82340;162866... 1 20140322 29953 595095853 41160643364 121364022 50008168 21458:80090256;1628665:29784;1628665:29796;162... 1 20150111 29954 1905258237 42298652641 121452056 50008168 21458:30992;1628665:3233942;1628665:31614;1628... 1 20150111 29955 1957645413 36768778465 121448033 38 6940834:29865;1628149:137593;21475:114226;2275... 1 20140815 29956 1854778218 37200665444 50012361 122650008 21458:3645338;13023209:544768204;122217803:309... 1 20140815 29957 268356658 36932456353 50010236 50014815 21458:10513072;12474507:706291650;3091143:9208... 1 20141027 29958 196272909 10066997901 50009540 50014815 21458:21906;13229910:32056435;2191928:73664723... 1 20141104 29959 23473499 38019470815 50010236 50014815 1628665:61550;1628665:3233940;1628665:3233936;... 1 20141104 29960 816394377 19835118833 50003700 28 24448:73774385;6725953:48332;22044:30715;80047... 1 20130912 29961 164859586 15842319049 50012479 28 NaN 1 20130912 29962 119149466 26396292642 50008875 28 21458:30992;11684888:104528258;21475:11488282;... 1 20130912 29963 704655047 10506866020 50007011 50008168 1628665:3233941;1628665:3233942;1628665:323393... 1 20121206 29964 45662429 20745380642 50010555 50008168 25935:31381;1628665:3233941;1628665:3233942;16... 1 20121206 29965 35711492 16563353438 50010544 50008168 21458:11580;25935:21991;1628665:92012;1628665:... 1 20121206 29966 57747284 35169635909 50010549 50008168 21458:125202070;22019:3228688;22019:3248884;22... 1 20140109 29967 287541325 19778523000 50007011 50008168 21458:112788583;1633959:3523439;3130834:209537... 2 20140109 29968 82915321 12766532512 50011993 28 21475:137325;1628665:3233937;1628665:29798;162... 1 20131008 29969 78259523 18309305134 50013711 50008168 21458:30992;1628665:29778;1628665:29793;163395... 1 20131008 29970 758305789 20177445814 50018860 28 21458:3602856;1628665:29784;1628665:3233941;73... 1 20131008 29589 rows × 7 columns df['cat1'].isin([28])#要写成列表的形式,即加上[] 0 False 1 True 2 False 3 False 4 False 5 False 6 False 7 False 8 True 9 True 10 False 11 False 12 False 13 True 14 False 15 False 16 False 17 False 18 False 19 True 20 True 21 False 22 False 23 False 24 False 25 False 26 False 27 False 28 False 29 False ... 29941 False 29942 False 29943 True 29944 False 29945 False 29946 False 29947 False 29948 True 29949 False 29950 True 29951 False 29952 False 29953 False 29954 False 29955 False 29956 False 29957 False 29958 False 29959 False 29960 True 29961 True 29962 True 29963 False 29964 False 29965 False 29966 False 29967 False 29968 True 29969 False 29970 True Name: cat1, Length: 29971, dtype: bool df[df['cat1'].isin([28,38])] user_id auction_id cat_id cat1 property buy_mount day 1 532110457 17916191097 50011993 28 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 8 82830661 19948600790 50013874 28 21458:11580;21475:137325 1 20121101 9 475046636 10368360710 203527 28 22724:40168;22729:40278;21458:21817;2770200:24... 1 20121101 10 734147966 15307958346 50018202 38 21458:3270827;7361532:28710594;7397093:7536994... 2 20121101 13 377550424 15771663914 50015841 28 1628665:3233941;1628665:3233942;3914866:11580;... 1 20121123 19 530850018 22058239899 50024147 28 21458:205007542;43307470:5543413;2339128:62147... 1 20140210 20 749507708 19171641742 50018860 28 21458:3602856;1628665:3233941;1628665:3233942;... 1 20140210 22 469517728 8232924597 211122 38 21458:21782;36786:42781029;13023102:6999219;22... 6 20140502 35 938309370 14149079479 50023669 28 21458:4204704;11820090:105550653;11644036:2861... 1 20120819 37 14466144 17610665576 50011993 28 21458:104000;21475:137325 1 20130327 38 177724549 14228645401 50018824 38 21475:108284;6933666:96059;33595:16453265;2145... 1 20130327 40 659020106 40484992676 50011993 28 21458:16162126;13023209:10551667;122218042:605... 1 20140813 43 18100946 38451267766 121540027 28 21458:215485914;125501489:19689726;11945782:78... 1 20140911 46 262519726 19051046285 121398041 28 11666049:40203;21458:3961150;17472269:13302841... 1 20140703 51 115566151 14778919435 50013187 28 1628665:3233938;1628665:29796;1628665:133527;1... 1 20140113 53 1714403831 22443564698 50014129 28 21458:57737100;12102318:7282254;11945782:78135... 1 20131106 64 1970876909 20197969079 211122 38 6940834:29865;21458:3270820;1629375:3253542;32... 1 20141017 70 113473924 15486726090 50014250 28 21458:30015090;1633959:43047819;1627584:28619;... 1 20120905 73 348660284 10896577394 50014250 28 1628665:29796;1628665:108579;1627584:11580;116... 1 20130525 77 151915451 17305821144 211122 38 21458:21782;36786:42781029;6933553:3313169;130... 2 20140104 78 745002413 36815797313 50023645 28 1628665:82340;21475:11488282;21458:56610575;49... 1 20140104 87 654037597 13775864723 50011993 28 21458:116116655;1633959:3276615;1628862:50276;... 1 20130513 89 277279277 18024521052 211122 38 21458:33516;33480:3238774;2653417:7353464;3359... 12 20130513 90 1721792494 36154660054 50008845 28 21458:3400531;5653832:7049425;13023209:7049425... 1 20140312 91 56549058 26930668292 50003700 28 21458:3351431;123273479:31526;1628665:3233941;... 1 20140312 92 696527486 37269469522 50011993 28 21458:118564374;13023209:547499553;122218042:3... 1 20140718 93 643153890 17954181229 50003700 28 123273479:41376163;21475:135183931;1628665:323... 1 20140718 95 1097191176 39095838474 50015841 28 1628665:3233941;1628665:3233942;1628665:323393... 1 20150203 106 669370290 40584762520 121540027 28 21458:215485914;125501489:598926205;11945782:7... 1 20141026 109 371153601 19893996909 251725 28 26318:52993;1627584:30689;11684888:104528258;2... 1 20121013 ... ... ... ... ... ... ... ... 29879 173729389 13926583575 50012474 28 21458:123482676;13023209:598168191;15673795:59... 1 20140501 29880 129479111 39677605554 50013187 28 1628665:3233938;1628665:82340;1628665:29793;21... 2 20141229 29886 788572516 18991044719 121466040 28 1628665:29784;1628665:29793;6907553:40595450;1... 2 20141129 29887 1031198213 22309900818 50011993 28 21458:113001124;13023209:52138064;29183816:568... 1 20141129 29889 860528533 14620263044 50011993 28 21458:115601688;1633959:138499706;1628862:3241... 1 20130925 29899 1614610402 17337612618 50016010 28 21458:30992;3989588:31285;3998392:40870415;399... 1 20131223 29902 696020002 23953356568 50011993 28 21458:34865735;1633959:3334315;1628862:33255;3... 1 20130523 29908 626575260 38862644631 50011993 28 122218042:21671;21475:135183931;1628861:21671;... 2 20140625 29909 2139869403 40339820434 50011993 28 122218042:117201278;21475:135183931;1628861:21... 1 20141210 29910 49369084 37942071105 50013190 28 21458:211472372;44818245:223495732;1628665:323... 1 20140615 29911 128447452 37728960808 50023670 28 21458:3482061;29121644:299472011;1628665:32339... 1 20140615 29912 1768157748 24644048682 50024150 28 21458:8244918;122277639:14934675;11688815:2167... 2 20141115 29914 45914430 16066366006 50014129 28 NaN 1 20130331 29921 1372572 16915013171 50008845 28 21458:30992;1628665:3233941;1628665:3233942;16... 1 20130327 29924 167288532 18836766607 50012788 28 2112993:29274;122277833:104377;1628665:3233941... 1 20140913 29926 2183330808 19704833222 50011993 28 21458:119679150;13023209:4067094;122218042:216... 1 20140913 29929 113446171 37455013590 50023663 28 11760865:6120557;21458:3314841;122277597:2054;... 1 20140831 29930 522850986 18220260582 122678023 28 21458:91312408;138253785:653822445;135925585:1... 1 20140831 29932 2212582093 16684531006 50006095 28 21458:3532516;8088680:4482698;1628665:3233941;... 1 20150205 29934 326432534 40599422228 50012428 28 1628665:3233941;1628665:29790;1628665:3233936;... 1 20150110 29939 2074613684 40798454555 203319 28 122217795:29277;134943792:29774;134943792:2977... 1 20141108 29943 797710454 18176728510 50013177 28 1628665:3233941;1628665:3233942;1628665:323393... 1 20130107 29948 68515755 13953276547 50012788 28 21458:12376977;2112993:32075;1628665:92012;162... 1 20130729 29950 801784345 17629938386 50023670 28 21458:3550980;29154281:231350353;11684888:1045... 1 20130729 29955 1957645413 36768778465 121448033 38 6940834:29865;1628149:137593;21475:114226;2275... 1 20140815 29960 816394377 19835118833 50003700 28 24448:73774385;6725953:48332;22044:30715;80047... 1 20130912 29961 164859586 15842319049 50012479 28 NaN 1 20130912 29962 119149466 26396292642 50008875 28 21458:30992;11684888:104528258;21475:11488282;... 1 20130912 29968 82915321 12766532512 50011993 28 21475:137325;1628665:3233937;1628665:29798;162... 1 20131008 29970 758305789 20177445814 50018860 28 21458:3602856;1628665:29784;1628665:3233941;73... 1 20131008 8166 rows × 7 columns
4.4 数据整理
- 横向堆叠:将两张表或多张表在X轴方向,即横向拼接在一起
- 纵向堆叠:将两张表或多张表在Y轴方向,即纵向拼接在一起
- 注意使用concat时,axis = 1代表横向,axis = 0代表纵向
- 注意join取inner或者outer时,
4.5 层次化索引
在一个轴上拥有两个或两个以上的索引:
- 使用loc语句进行访问
- loc里面接收tuple,如loc[(a,b), :]
df = pd.read_csv('baby_trade_history.csv', dtype = {'user_id':str}, index_col = [3,0])#第4列和第1列作为索引读入 df auction_id cat_id property buy_mount day cat1 user_id 50022520 786295544 41098319944 50014866 21458:86755362;13023209:3593274;10984217:21985... 2 20140919 28 532110457 17916191097 50011993 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 50014815 249013725 21896936223 50012461 21458:30992;1628665:92012;1628665:3233938;1628... 1 20131011 917056007 12515996043 50018831 21458:15841995;21956:3494076;27000458:59723383... 2 20141023 50008168 444069173 20487688075 50013636 21458:30992;13658074:3323064;1628665:3233941;1... 1 20141103 152298847 41840167463 121394024 21458:3408353;13023209:727117752;22009:2741771... 1 20141103 513441334 19909384116 50010557 25935:21991;1628665:29784;22019:34731;22019:20... 1 20121212 297411659 13540124907 50010542 21458:60020529;25935:31381;1633959:27247291;16... 1 20121212 28 82830661 19948600790 50013874 21458:11580;21475:137325 1 20121101 475046636 10368360710 203527 22724:40168;22729:40278;21458:21817;2770200:24... 1 20121101 38 734147966 15307958346 50018202 21458:3270827;7361532:28710594;7397093:7536994... 2 20121101 122650008 68547330 21162876126 50012365 1628665:3233941;1628665:3233942;1628665:323393... 1 20121123 50008168 697081418 15898050723 50013636 21458:19726868;1633959:179425852;13836282:1290... 1 20121123 28 377550424 15771663914 50015841 1628665:3233941;1628665:3233942;3914866:11580;... 1 20121123 50008168 88313935 22532727492 50013711 1628665:3233941;1628665:3233942;22019:3340598;... 1 20131005 122650008 25918750 16078389250 50012359 21458:3405407;1633959:6186201;1628366:32799;81... 1 20131005 50008168 350288528 35086271572 50010544 21458:61813;25935:21991;1628665:3233938;162866... 1 20131129 50014815 348090113 17436967558 50009540 21458:21910;3110425:30696849;2191928:75373546;... 1 20131129 50008168 1635282280 36153356431 50013207 1628665:29784;1628665:29799;2904342:31004;2201... 1 20131129 28 530850018 22058239899 50024147 21458:205007542;43307470:5543413;2339128:62147... 1 20140210 749507708 19171641742 50018860 21458:3602856;1628665:3233941;1628665:3233942;... 1 20140210 50008168 201088567 38564176352 50013207 1628665:3233941;1628665:3233942;1628665:323393... 1 20140502 38 469517728 8232924597 211122 21458:21782;36786:42781029;13023102:6999219;22... 6 20140502 50014815 691367866 17712372914 121434042 21458:49341152;8021059:5525523;6851452:1398669... 1 20140804 77193822 35537441586 50006520 22277:6262384;21458:30992;1628665:3233941;1628... 2 20140804 50008168 605678021 15502618744 50010555 25935:31381;1628665:3233941;1628665:3233942;16... 1 20130226 50014815 47702620 26481508332 121412034 21458:49341152;11057903:4036007;130475532:7537... 1 20140918 122650008 763560371 40945285800 50012365 21458:30992;1628665:3233939;22007:30338;22007:... 1 20150201 50008168 408028533 35838498718 50012442 21458:3596449;6811831:3446999;13023209:3446999... 1 20141009 53566371 27177784760 121394024 21458:42090508;1628665:3233941;1628665:3233942... 1 20141009 ... ... ... ... ... ... ... 50014815 413188001 16521677358 50012478 21458:28155;5434803:3636603;2815901:22583732;1... 1 20130107 50008168 474062095 21129724585 50013207 21458:21599;1628665:29798;1628665:3233938;1628... 1 20130107 28 797710454 18176728510 50013177 1628665:3233941;1628665:3233942;1628665:323393... 1 20130107 50008168 1716505453 37844041565 50010555 21458:30992;25935:31381;1628665:3233941;162866... 1 20141231 122650008 1966692323 42504930457 50012359 21458:3379652;1628665:3233940;1628665:3233938;... 1 20141231 50014815 641734831 22105131076 50014277 21458:21906;13227811:51479;13230966:75369014;3... 2 20141016 50008168 731030177 41666438142 121394024 21458:3443560;1628665:3233942;1628665:3233938;... 1 20141016 28 68515755 13953276547 50012788 21458:12376977;2112993:32075;1628665:92012;162... 1 20130729 50008168 180436843 23375100402 50012451 21458:33514;1633959:13343071;33030:29800;33162... 1 20130729 28 801784345 17629938386 50023670 21458:3550980;29154281:231350353;11684888:1045... 1 20130729 50008168 124458824 19739113764 50013636 21458:30992;13658074:9306734;1628665:3233941;1... 1 20140322 122650008 602141957 37251457564 50012360 21458:21599;1628665:29798;1628665:82340;162866... 1 20140322 50008168 595095853 41160643364 121364022 21458:80090256;1628665:29784;1628665:29796;162... 1 20150111 1905258237 42298652641 121452056 21458:30992;1628665:3233942;1628665:31614;1628... 1 20150111 38 1957645413 36768778465 121448033 6940834:29865;1628149:137593;21475:114226;2275... 1 20140815 122650008 1854778218 37200665444 50012361 21458:3645338;13023209:544768204;122217803:309... 1 20140815 50014815 268356658 36932456353 50010236 21458:10513072;12474507:706291650;3091143:9208... 1 20141027 196272909 10066997901 50009540 21458:21906;13229910:32056435;2191928:73664723... 1 20141104 23473499 38019470815 50010236 1628665:61550;1628665:3233940;1628665:3233936;... 1 20141104 28 816394377 19835118833 50003700 24448:73774385;6725953:48332;22044:30715;80047... 1 20130912 164859586 15842319049 50012479 NaN 1 20130912 119149466 26396292642 50008875 21458:30992;11684888:104528258;21475:11488282;... 1 20130912 50008168 704655047 10506866020 50007011 1628665:3233941;1628665:3233942;1628665:323393... 1 20121206 45662429 20745380642 50010555 25935:31381;1628665:3233941;1628665:3233942;16... 1 20121206 35711492 16563353438 50010544 21458:11580;25935:21991;1628665:92012;1628665:... 1 20121206 57747284 35169635909 50010549 21458:125202070;22019:3228688;22019:3248884;22... 1 20140109 287541325 19778523000 50007011 21458:112788583;1633959:3523439;3130834:209537... 2 20140109 28 82915321 12766532512 50011993 21475:137325;1628665:3233937;1628665:29798;162... 1 20131008 50008168 78259523 18309305134 50013711 21458:30992;1628665:29778;1628665:29793;163395... 1 20131008 28 758305789 20177445814 50018860 21458:3602856;1628665:29784;1628665:3233941;73... 1 20131008 29971 rows × 5 columns df.loc[28]#把第一层索引为28的取出来 auction_id cat_id property buy_mount day user_id 532110457 17916191097 50011993 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 82830661 19948600790 50013874 21458:11580;21475:137325 1 20121101 475046636 10368360710 203527 22724:40168;22729:40278;21458:21817;2770200:24... 1 20121101 377550424 15771663914 50015841 1628665:3233941;1628665:3233942;3914866:11580;... 1 20121123 530850018 22058239899 50024147 21458:205007542;43307470:5543413;2339128:62147... 1 20140210 749507708 19171641742 50018860 21458:3602856;1628665:3233941;1628665:3233942;... 1 20140210 938309370 14149079479 50023669 21458:4204704;11820090:105550653;11644036:2861... 1 20120819 14466144 17610665576 50011993 21458:104000;21475:137325 1 20130327 659020106 40484992676 50011993 21458:16162126;13023209:10551667;122218042:605... 1 20140813 18100946 38451267766 121540027 21458:215485914;125501489:19689726;11945782:78... 1 20140911 262519726 19051046285 121398041 11666049:40203;21458:3961150;17472269:13302841... 1 20140703 115566151 14778919435 50013187 1628665:3233938;1628665:29796;1628665:133527;1... 1 20140113 1714403831 22443564698 50014129 21458:57737100;12102318:7282254;11945782:78135... 1 20131106 113473924 15486726090 50014250 21458:30015090;1633959:43047819;1627584:28619;... 1 20120905 348660284 10896577394 50014250 1628665:29796;1628665:108579;1627584:11580;116... 1 20130525 745002413 36815797313 50023645 1628665:82340;21475:11488282;21458:56610575;49... 1 20140104 654037597 13775864723 50011993 21458:116116655;1633959:3276615;1628862:50276;... 1 20130513 1721792494 36154660054 50008845 21458:3400531;5653832:7049425;13023209:7049425... 1 20140312 56549058 26930668292 50003700 21458:3351431;123273479:31526;1628665:3233941;... 1 20140312 696527486 37269469522 50011993 21458:118564374;13023209:547499553;122218042:3... 1 20140718 643153890 17954181229 50003700 123273479:41376163;21475:135183931;1628665:323... 1 20140718 1097191176 39095838474 50015841 1628665:3233941;1628665:3233942;1628665:323393... 1 20150203 669370290 40584762520 121540027 21458:215485914;125501489:598926205;11945782:7... 1 20141026 371153601 19893996909 251725 26318:52993;1627584:30689;11684888:104528258;2... 1 20121013 724395786 20690772279 50023531 1628665:3233941;1628665:3233939;1628665:92012;... 1 20121117 272455031 26087972097 50013881 21458:198089538;36299855:3236128;1633959:32344... 1 20130726 120447438 19100818270 50003700 24448:45985;1628665:3233941;1628665:3233942;16... 1 20130726 45142316 36723659574 121452027 21458:32270;13023209:11866882;29141524:1186688... 1 20140827 1047298224 14653385559 121540027 21458:57737100;125499563:4122807;11945782:7813... 1 20150111 47326167 16078574732 50023670 21458:3482061;29121644:11529;21475:38370940 1 20121130 ... ... ... ... ... ... 1750892012 24412908364 122690023 21458:3325894;138691920:244463779;18822961:284... 1 20140907 173729389 13926583575 50012474 21458:123482676;13023209:598168191;15673795:59... 1 20140501 129479111 39677605554 50013187 1628665:3233938;1628665:82340;1628665:29793;21... 2 20141229 788572516 18991044719 121466040 1628665:29784;1628665:29793;6907553:40595450;1... 2 20141129 1031198213 22309900818 50011993 21458:113001124;13023209:52138064;29183816:568... 1 20141129 860528533 14620263044 50011993 21458:115601688;1633959:138499706;1628862:3241... 1 20130925 1614610402 17337612618 50016010 21458:30992;3989588:31285;3998392:40870415;399... 1 20131223 696020002 23953356568 50011993 21458:34865735;1633959:3334315;1628862:33255;3... 1 20130523 626575260 38862644631 50011993 122218042:21671;21475:135183931;1628861:21671;... 2 20140625 2139869403 40339820434 50011993 122218042:117201278;21475:135183931;1628861:21... 1 20141210 49369084 37942071105 50013190 21458:211472372;44818245:223495732;1628665:323... 1 20140615 128447452 37728960808 50023670 21458:3482061;29121644:299472011;1628665:32339... 1 20140615 1768157748 24644048682 50024150 21458:8244918;122277639:14934675;11688815:2167... 2 20141115 45914430 16066366006 50014129 NaN 1 20130331 1372572 16915013171 50008845 21458:30992;1628665:3233941;1628665:3233942;16... 1 20130327 167288532 18836766607 50012788 2112993:29274;122277833:104377;1628665:3233941... 1 20140913 2183330808 19704833222 50011993 21458:119679150;13023209:4067094;122218042:216... 1 20140913 113446171 37455013590 50023663 11760865:6120557;21458:3314841;122277597:2054;... 1 20140831 522850986 18220260582 122678023 21458:91312408;138253785:653822445;135925585:1... 1 20140831 2212582093 16684531006 50006095 21458:3532516;8088680:4482698;1628665:3233941;... 1 20150205 326432534 40599422228 50012428 1628665:3233941;1628665:29790;1628665:3233936;... 1 20150110 2074613684 40798454555 203319 122217795:29277;134943792:29774;134943792:2977... 1 20141108 797710454 18176728510 50013177 1628665:3233941;1628665:3233942;1628665:323393... 1 20130107 68515755 13953276547 50012788 21458:12376977;2112993:32075;1628665:92012;162... 1 20130729 801784345 17629938386 50023670 21458:3550980;29154281:231350353;11684888:1045... 1 20130729 816394377 19835118833 50003700 24448:73774385;6725953:48332;22044:30715;80047... 1 20130912 164859586 15842319049 50012479 NaN 1 20130912 119149466 26396292642 50008875 21458:30992;11684888:104528258;21475:11488282;... 1 20130912 82915321 12766532512 50011993 21475:137325;1628665:3233937;1628665:29798;162... 1 20131008 758305789 20177445814 50018860 21458:3602856;1628665:29784;1628665:3233941;73... 1 20131008 6963 rows × 5 columns df.loc[28].loc[758305789] auction_id 20177445814 cat_id 50018860 property 21458:3602856;1628665:29784;1628665:3233941;73... buy_mount 1 day 20131008 Name: 758305789, dtype: object df.loc[28].loc[[82915321,758305789]]#取出第1层索引为28,第2层索引为82915321和758305789的数据(以列表的形式给出). auction_id cat_id property buy_mount day user_id 82915321 12766532512 50011993 21475:137325;1628665:3233937;1628665:29798;162... 1 20131008 758305789 20177445814 50018860 21458:3602856;1628665:29784;1628665:3233941;73... 1 20131008 df.loc[(28,[82915321,758305789]), ['auction_id','cat_id']]#行,列 行以元组的形式给出 auction_id cat_id cat1 user_id 28 82915321 12766532512 50011993 758305789 20177445814 50018860 df.loc[([28,38],)]#第1层索引是28和38的 auction_id cat_id property buy_mount day cat1 user_id 28 532110457 17916191097 50011993 21458:11399317;1628862:3251296;21475:137325;16... 1 20131011 82830661 19948600790 50013874 21458:11580;21475:137325 1 20121101 475046636 10368360710 203527 22724:40168;22729:40278;21458:21817;2770200:24... 1 20121101 38 734147966 15307958346 50018202 21458:3270827;7361532:28710594;7397093:7536994... 2 20121101 28 377550424 15771663914 50015841 1628665:3233941;1628665:3233942;3914866:11580;... 1 20121123 530850018 22058239899 50024147 21458:205007542;43307470:5543413;2339128:62147... 1 20140210 749507708 19171641742 50018860 21458:3602856;1628665:3233941;1628665:3233942;... 1 20140210 38 469517728 8232924597 211122 21458:21782;36786:42781029;13023102:6999219;22... 6 20140502 28 938309370 14149079479 50023669 21458:4204704;11820090:105550653;11644036:2861... 1 20120819 14466144 17610665576 50011993 21458:104000;21475:137325 1 20130327 38 177724549 14228645401 50018824 21475:108284;6933666:96059;33595:16453265;2145... 1 20130327 28 659020106 40484992676 50011993 21458:16162126;13023209:10551667;122218042:605... 1 20140813 18100946 38451267766 121540027 21458:215485914;125501489:19689726;11945782:78... 1 20140911 262519726 19051046285 121398041 11666049:40203;21458:3961150;17472269:13302841... 1 20140703 115566151 14778919435 50013187 1628665:3233938;1628665:29796;1628665:133527;1... 1 20140113 1714403831 22443564698 50014129 21458:57737100;12102318:7282254;11945782:78135... 1 20131106 38 1970876909 20197969079 211122 6940834:29865;21458:3270820;1629375:3253542;32... 1 20141017 28 113473924 15486726090 50014250 21458:30015090;1633959:43047819;1627584:28619;... 1 20120905 348660284 10896577394 50014250 1628665:29796;1628665:108579;1627584:11580;116... 1 20130525 38 151915451 17305821144 211122 21458:21782;36786:42781029;6933553:3313169;130... 2 20140104 28 745002413 36815797313 50023645 1628665:82340;21475:11488282;21458:56610575;49... 1 20140104 654037597 13775864723 50011993 21458:116116655;1633959:3276615;1628862:50276;... 1 20130513 38 277279277 18024521052 211122 21458:33516;33480:3238774;2653417:7353464;3359... 12 20130513 28 1721792494 36154660054 50008845 21458:3400531;5653832:7049425;13023209:7049425... 1 20140312 56549058 26930668292 50003700 21458:3351431;123273479:31526;1628665:3233941;... 1 20140312 696527486 37269469522 50011993 21458:118564374;13023209:547499553;122218042:3... 1 20140718 643153890 17954181229 50003700 123273479:41376163;21475:135183931;1628665:323... 1 20140718 1097191176 39095838474 50015841 1628665:3233941;1628665:3233942;1628665:323393... 1 20150203 669370290 40584762520 121540027 21458:215485914;125501489:598926205;11945782:7... 1 20141026 371153601 19893996909 251725 26318:52993;1627584:30689;11684888:104528258;2... 1 20121013 ... ... ... ... ... ... 173729389 13926583575 50012474 21458:123482676;13023209:598168191;15673795:59... 1 20140501 129479111 39677605554 50013187 1628665:3233938;1628665:82340;1628665:29793;21... 2 20141229 788572516 18991044719 121466040 1628665:29784;1628665:29793;6907553:40595450;1... 2 20141129 1031198213 22309900818 50011993 21458:113001124;13023209:52138064;29183816:568... 1 20141129 860528533 14620263044 50011993 21458:115601688;1633959:138499706;1628862:3241... 1 20130925 1614610402 17337612618 50016010 21458:30992;3989588:31285;3998392:40870415;399... 1 20131223 696020002 23953356568 50011993 21458:34865735;1633959:3334315;1628862:33255;3... 1 20130523 626575260 38862644631 50011993 122218042:21671;21475:135183931;1628861:21671;... 2 20140625 2139869403 40339820434 50011993 122218042:117201278;21475:135183931;1628861:21... 1 20141210 49369084 37942071105 50013190 21458:211472372;44818245:223495732;1628665:323... 1 20140615 128447452 37728960808 50023670 21458:3482061;29121644:299472011;1628665:32339... 1 20140615 1768157748 24644048682 50024150 21458:8244918;122277639:14934675;11688815:2167... 2 20141115 45914430 16066366006 50014129 NaN 1 20130331 1372572 16915013171 50008845 21458:30992;1628665:3233941;1628665:3233942;16... 1 20130327 167288532 18836766607 50012788 2112993:29274;122277833:104377;1628665:3233941... 1 20140913 2183330808 19704833222 50011993 21458:119679150;13023209:4067094;122218042:216... 1 20140913 113446171 37455013590 50023663 11760865:6120557;21458:3314841;122277597:2054;... 1 20140831 522850986 18220260582 122678023 21458:91312408;138253785:653822445;135925585:1... 1 20140831 2212582093 16684531006 50006095 21458:3532516;8088680:4482698;1628665:3233941;... 1 20150205 326432534 40599422228 50012428 1628665:3233941;1628665:29790;1628665:3233936;... 1 20150110 2074613684 40798454555 203319 122217795:29277;134943792:29774;134943792:2977... 1 20141108 797710454 18176728510 50013177 1628665:3233941;1628665:3233942;1628665:323393... 1 20130107 68515755 13953276547 50012788 21458:12376977;2112993:32075;1628665:92012;162... 1 20130729 801784345 17629938386 50023670 21458:3550980;29154281:231350353;11684888:1045... 1 20130729 38 1957645413 36768778465 121448033 6940834:29865;1628149:137593;21475:114226;2275... 1 20140815 28 816394377 19835118833 50003700 24448:73774385;6725953:48332;22044:30715;80047... 1 20130912 164859586 15842319049 50012479 NaN 1 20130912 119149466 26396292642 50008875 21458:30992;11684888:104528258;21475:11488282;... 1 20130912 82915321 12766532512 50011993 21475:137325;1628665:3233937;1628665:29798;162... 1 20131008 758305789 20177445814 50018860 21458:3602856;1628665:29784;1628665:3233941;73... 1 20131008 8166 rows × 5 columns
欢迎阅读数据清洗系列文章:python数据清洗工具、方法、过程整理归纳
- 一、数据清洗之常用工具——numpy,pandas
- 二、数据清洗之文件读写——读取csv、Excel和MySQL数据
- 三、数据清洗之数据表操作——数据筛选、增加删除、查找修改、数据整理和层次化索引
- 四、数据清洗之数据转换——日期格式数据处理、高阶函数数据处理、字符串数据处理
- 五、数据清洗之数据统计——数据分组运算、聚合函数使用、分组对象和apply函数、透视图与交叉表
- 六、数据清洗之数据预处理(一)——重复值处理、缺失值处理
- 七、数据清洗之数据预处理(二)——异常值处理、数据离散化处理
- 八、总结
- 点赞
- 收藏
- 分享
- 文章举报
相关文章推荐
- python数据清洗工具、方法、过程整理归纳(六、数据清洗之数据预处理(一)——重复值处理、缺失值处理)
- python数据清洗工具、方法、过程整理归纳(八、总结)
- python数据清洗工具、方法、过程整理归纳(四、数据清洗之数据转换——日期格式数据处理、高阶函数数据处理、字符串数据处理)
- python数据清洗工具、方法、过程整理归纳(七、数据清洗之数据预处理(二)——异常值处理、数据离散化处理)
- python数据清洗工具、方法、过程整理归纳(五、数据清洗之数据统计——数据分组运算、聚合函数使用、分组对象和apply函数、透视图与交叉表)
- Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR一、查询数据集合
- JPA数据的操作:增加,删除,修改,获取,使用JPOL进行查询
- vb.net操作注册表的方法分析【增加,修改,删除,查询】
- 项目经验之:利用Jquery+HTML静态模版实现数据的展示及无刷新增加,修改,删除,分页操作!!!
- <3> 单链表的各种操作(创建、增加、删除、修改、查找、逆序、判空、置空等)
- 利用Jquery+HTML静态模版实现数据的展示及无刷新增加,修改,删除,分页操作!
- 集插入,删除,修改一体的操作数据库数据的方法
- python简单的数据清洗,数据筛选方法归类
- solr入门之lucene的索引操作之增加,删除,修改,查询及查询解析代码模板
- 简单一维动态链表的相关操作:查找、插入、删除、修改、增加
- JAVA+JDBC对数据库的数据进行增加、修改、删除、查询等操作
- Flask框架(SQLAlchemy(python3版本)中修改数据的方法和删除数据 的方法)
- AS3 操作XML,增加、删除、修改、查找
- Python中的列表(添加二元列表、连接、查找、排序、反序、赋值、删除、分片操作、负索引、)
- JPA学习笔记---JPA数据的操作:增加,删除,修改,获取,使用JPQL进行查询