您的位置：首页 > 编程语言 > Python开发

Python学习（1）：基本数据类型

2016-07-17 21:24 369 查看

python是一门新兴的胶水语言，在国外得到了广泛的应用。在国外，编程基础课一般会选择pyhon作为编程语言。在国内，大学编程课上使用的语言一开始都是C语言，几年来也在逐渐往python上转。python以其简单易用，函数库众多而备受青睐。在机器学习领域，学术界一般会用matlab或者R来做相关的研究。而由于matlab属于付费软件，其使用受到版权的限制，因而在工业界应用不多。python、scala、tenserflow是目前机器学习方面使用比较多的的几门编程语言。

一、编程环境

pyhon安装：

1.首先下载安装python。

2.安装下载包。

3.添加环境变量，把python的安装路径添加到path中。

4.测试。在cmd中输入python，出现版本信息即为安装成功。

为了方便安装pyhon的其它安装包，一般会用到pip方法。有了pip之后，再安装python的其它库时，可以直接在cmd中输入pip install XXX（pyhon库名）即可安装。

pip安装：

1.下载最新的PIP安装文件。

2.解压安装。

3.下载Windows的easy install，并安装。

4.安装setuptools工具。

5.命令行工具cd切换到pip的目录，找到setup.py文件，然后输入python setup.py install，运行即可（之所以能运行这步，是因为之前安装的setuptools工具，以后就可以随意安装python的库了，只要找对setup.py文件的路径，运行上述命令，就可以方便的安装了）。

6.把python的安装路径添加到环境变量path中，例如G:\python2.6\Scripts

7.完成！

二、基本语法

python的基本语法与C语言、matlab基本一致，个人觉得python是更接近与matlab的一门语言。

python中对于制表符（Tab）的运用十分严格，错误的对齐方式会导致程序编译出错。这个特点带来的一个好处是python中一个语句块结束的时候，不需要附加标识符。在C语言中需要用“{}”来表明这是一个语句块。在matlab中用end来表示语句块的结束。在python中这些都是不必要的。当需要写一个语句块时，在前面加上制表符（Tab）就行。退出语句块时，则不加制表符（Tab）即可。

python中的for、while、break、continue的运用与其他编程语言相同，不再过多介绍。

python中的 in 操作的使用在C语言和matlab中都没有，因此特别地提一提。一般情况下，s1 in s表示是否在s中存在s1序列，存在则返回True。而在循环中，如 for a in s: 则会依次将s中的元素赋给a。

python的print(): 对于需要格式化输出某个变量的值的时候，print的用法与C语言类似，但是还有所不同。一般用法有两种，分别为：

name='Hansyang'
print("My name is %s and weight is %d kg!" % ('Hansyang', 22) )
print("My name is”,name, "and weight is", 22)

两种方法不能混合使用。

格式化字符的符号为：

%c 格式化字符及其ASCII码

%s 格式化字符串

%d 格式化整数

%u 格式化无符号整型

%o 格式化无符号八进制数

%x 格式化无符号十六进制数

%X 格式化无符号十六进制数（大写）

%f 格式化浮点数字，可指定小数点后的精度

%e 用科学计数法格式化浮点数

%E 作用同%e，用科学计数法格式化浮点数

%g %f和%e的简写

%G %f 和 %E 的简写

%p 用十六进制数格式化变量的地址

三、变量类型

Python 中的数据基本分为数字、字符串、列表、元组和字典。

变量类型的定义：

数字：无标识，直接赋值为数字，如：s=5。

字符串：”“或者”进行标识，如s=’hello world’或者s=”hello world”。

列表：最常用的类型，用[]进行标识，如：s=[‘abcd’,123,2]。

元组：只读列表，不可二次赋值，用()进行标识，如s=(‘abcd’,123,2)。

字典：用{x:y,}来标识，如：s={‘name’:’zhangsan’,’age’:22}。需要注意的是中间的“：”必须存在。此处区别于集合类数据，集合是将所有量当成集合元素来考虑，重复的量将会被当成同种元素，常用于去除重复量。二者存在很大区别。

每种变量有其特殊方法：

数字：

对于数字类的变量，有一些常用函数，不属于任何包，可直接使用的有：

函数返回值 ( 描述 )

abs(x) 返回数字的绝对值，如abs(-10) 返回 10

ceil(x) 返回数字的上入整数，如math.ceil(4.1) 返回 5

cmp(x, y) 如果 x < y 返回 -1, 如果 x == y 返回 0, 如果 x > y 返回 1

exp(x) 返回e的x次幂(ex),如math.exp(1) 返回2.718281828459045

fabs(x) 返回数字的绝对值，如math.fabs(-10) 返回10.0

floor(x) 返回数字的下舍整数，如math.floor(4.9)返回 4

log(x) 如math.log(math.e)返回1.0,math.log(100,10)返回2.0

log10(x) 返回以10为基数的x的对数，如math.log10(100)返回 2.0

max(x1, x2,…) 返回给定参数的最大值，参数可以为序列。

min(x1, x2,…) 返回给定参数的最小值，参数可以为序列。

modf(x) 返回x的整数部分与小数部分，两部分的数值符号与x相同，整数部分以浮点型表示。

pow(x, y) x**y 运算后的值。

round(x [,n]) 返回浮点数x的四舍五入值，如给出n值，则代表舍入到小数点后的位数。

sqrt(x) 返回数字x的平方根，数字可以为负数，返回类型为实数，如math.sqrt(4)返回 2+0j。

对于随机数，需要在import随机数的包之后才能使用：

choice(seq) 从序列的元素中随机挑选一个元素，比如random.choice(range(10))，从0到9中随机挑选一个整数。

randrange ([start,] stop [,step]) 从指定范围内，按指定基数递增的集合中获取一个随机数，基数缺省值为1

random() 随机生成下一个实数，它在[0,1)范围内。

seed([x]) 改变随机数生成器的种子seed。如果你不了解其原理，你不必特别去设定seed，Python会帮你选择seed。

shuffle(lst) 将序列的所有元素随机排序

uniform(x, y) 随机生成下一个实数，它在[x,y]范围内。

还有其他的比如三角函数等，不太常用，故不列出。

列表

对于列表类和字符串类的变量，可以通过s[i]的方式访问单个元素值，也可以用s[j:k]的方式访问多个连续元素。

在列表、字符串中都可以用‘+’来实现两个同类变量的连接，而在字典中则不可以使用‘+’来实现。

同时，还可以用*来实现列表的重复。

del s[k] 可以删除列表中的某个变量。

len(s) 获得列表长度。

max(s)/min(s) 最大/最小值。

cmp(s1,s2) 比较是否相同。

s.count(obj) 统计某个元素在列表中出现的次数

s.index(obj) 从列表中找出某个值第一个匹配项的索引位置

s.insert(index, obj) 将对象插入列表

s.pop(index=-1) 移除列表中的一个元素（默认最后一个元素），并且返回
4000
该元素的值

s.remove(obj) 移除列表中某个值的第一个匹配项

s.reverse() 反向列表中元素

s.sort([func]) 对原列表进行排序

s.extend(s1) 在列表末尾一次性追加另一个序列中的多个值（用新列表扩展原来的列表）,即将s1中的每个元素依次加在s的后面，与’+’的作用相同。

s.append(s1) 将s1作为一个整体，加在s后面。注意此处需要与s.extend区分开来。

示例：

s0=[1,2,3,4]
s1=s0
s2=[1,2]
print(s0.extend(s2))
print(s1.append(s2))

结果为：

[1,2,3,4,1,2]
[1,2,3,4,[1,2]]

字符串

对于字符串的操作与对于列表的基础操作基本一致，包括’+’，’*’的使用和字符串元素的读取，都是一致的。字符串的函数与列表的函数存在很大区别：

string.capitalize() 把字符串的第一个字符大写

string.center(width) 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串

string.count(str, beg=0, end=len(string)) 返回 str 在 string 里面出现的次数，如果 beg 或者 end 指定则返回指定范围内 str 出现的次数

string.decode(encoding=’UTF-8’, errors=’strict’) 以 encoding 指定的编码格式解码 string，如果出错默认报一个 ValueError 的异常，除非 errors 指定的是 ‘ignore’ 或者’replace’

string.encode(encoding=’UTF-8’, errors=’strict’) 以 encoding 指定的编码格式编码 string，如果出错默认报一个ValueError 的异常，除非 errors 指定的是’ignore’或者’replace’

string.endswith(obj, beg=0, end=len(string)) 检查字符串是否以 obj 结束，如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束，如果是，返回 True,否则返回 False.

string.expandtabs(tabsize=8) 把字符串 string 中的 tab 符号转为空格，tab 符号默认的空格数是 8。

string.find(str, beg=0, end=len(string)) 检测 str 是否包含在 string 中，如果 beg 和 end 指定范围，则检查是否包含在指定范围内，如果是返回开始的索引值，否则返回-1

string.index(str, beg=0, end=len(string)) 跟find()方法一样，只不过如果str不在 string中会报一个异常.

string.isalnum() 如果 string 至少有一个字符并且所有字符都是字母或数字则返

回 True,否则返回 False

string.isalpha() 如果 string 至少有一个字符并且所有字符都是字母则返回 True,

否则返回 False

string.isdecimal() 如果 string 只包含十进制数字则返回 True 否则返回 False.

string.isdigit() 如果 string 只包含数字则返回 True 否则返回 False.

string.islower() 如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回 True，否则返回 False

string.isnumeric() 如果 string 中只包含数字字符，则返回 True，否则返回 False

string.isspace() 如果 string 中只包含空格，则返回 True，否则返回 False.

string.istitle() 如果 string 是标题化的(见 title())则返回 True，否则返回 False

string.isupper() 如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False

string.join(seq) 以 string 作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串

string.ljust(width) 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串

string.lower() 转换 string 中所有大写字符为小写.

string.lstrip() 截掉 string 左边的空格

string.maketrans(intab, outtab]) maketrans() 方法用于创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。

max(str) 返回字符串 str 中最大的字母。

min(str) 返回字符串 str 中最小的字母。

string.partition(str) 有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把字符串 string 分成一个 3 元素的元组 (string_pre_str,str,string_post_str),如果 string 中不包含str 则 string_pre_str == string.

string.replace(str1, str2, num=string.count(str1)) 把 string 中的 str1 替换成 str2,如果 num 指定，则替换不超过 num 次.

string.rfind(str, beg=0,end=len(string) ) 类似于 find()函数，不过是从右边开始查找.

string.rindex( str, beg=0,end=len(string)) 类似于 index()，不过是从右边开始.

string.rjust(width) 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串

string.rpartition(str) 类似于 partition()函数,不过是从右边开始查找.

string.rstrip() 删除 string 字符串末尾的空格.

string.split(str=”“, num=string.count(str)) 以 str 为分隔符切片 string，如果 num有指定值，则仅分隔 num 个子字符串

string.splitlines(num=string.count(‘\n’)) 按照行分隔，返回一个包含各行作为元素的列表，如果 num 指定则仅切片 num 个行.

string.startswith(obj, beg=0,end=len(string)) 检查字符串是否是以 obj 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查.

string.strip([obj]) 在 string 上执行 lstrip()和 rstrip()

string.swapcase() 翻转 string 中的大小写

string.title() 返回”标题化”的 string,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())

string.translate(str, del=”“) 根据 str 给出的表(包含 256 个字符)转换 string 的字符,

要过滤掉的字符放到 del 参数中

string.upper() 转换 string 中的小写字母为大写

string.zfill(width) 返回长度为 width 的字符串，原字符串 string 右对齐，前面填充0

string.isdecimal() isdecimal()方法检查字符串是否只包含十进制字符。这种方法只存在于unicode对象。

元组

使用较少，不作介绍。

字典

字典中每个元素由键和键值组成，键可以是数字、字符串或者元组，不能是列表。键相当于每个元素的身份证号，必须唯一。创建时，如果有一个键被用了两次，只有后一个的值会被保存下来。

字典中的元素的访问与列表类似，不同之处在于编号变成了键。

字典的内置函数和方法有：

cmp(dict1, dict2) 比较两个字典元素。

len(dict) 计算字典元素个数，即键的总数。

str(dict) 输出字典可打印的字符串表示。

type(variable) 返回输入的变量类型，如果变量是字典就返回字典类型。

dict.clear() 删除字典内所有元素

dict.copy() 返回一个字典的浅复制

dict.fromkeys(seq,val) 创建一个新字典，以序列seq中元素做字典的键，val为字典所有键对应的初始值

dict.get(key, default=None) 返回指定键的值，如果值不在字典中返回default值dict.has_key(key) 如果键在字典dict里返回true，否则返回false

dict.items() 以列表返回可遍历的(键, 值) 元组数组

dict.keys() 以列表返回一个字典所有的键

dict.setdefault(key, default=None) 和get()类似, 但如果键不存在于字典中，将会添加键并将值设为default

dict.update(dict2) 把字典dict2的键/值对更新到dict里

dict.values() 以列表返回字典中的所有值

结束语

python中的基本变量类型就只有以上五种，由于元组不常用，其实真正常用的变量类型只有四种。掌握了这四种变量类型，就算基本掌握了python的使用，至少在topcoder的SRM比赛中，基本就可以使用python来进行编程了。但是仅仅掌握这部分内容，只是掌握了python中最基础的用法。要想使用python来进行机器学习算法的开发，还有很多东西需要学习。

后期对于python的学习中，将会在文件处理、GUI编程、多线程、分布式计算等方面逐层深入。由于python简单易用的特点，对于有编程基础的人来说，学习阶段应该在一周内就能完成。后期的项目实训，才是耗时费力的阶段。

我在之前的学习中，对于Java和C++都有过接触，曾经也想学习这两门编程语言。但是学习的时候都是零零散散，最后花了很多时间，还是没有掌握这两门语言的用法。每次参加SRM算法比赛，要么是在C++的框架下写C代码，要么就是边写Java边查各个类型的变量的用法。后期如果有时间，可以考虑系统地把这两门语言的基础性的用法再过一遍，以便将来在面对实际项目时，有更多的选择。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： python 编程语言机器学习

相关文章推荐

新的分享

章节导航