在编程领域,理解和掌握各种数据类型是任何编程语言的基础,Python 也不例外。Python 3 提供了多种内置数据类型,包括但不限于数字(整型、浮点型、复数)、布尔型、列表、元组、字符串、集合、字典等,还有函数、模块等高级类型。每种数据类型都有其特定的特性和适用场景。

在 Python 中,变量可以被理解为一个标签(tag)或者标记,它是附着在特定对象上的名字。你可以将这个理念理解为在超市里的商品标签,标签告诉你这是什么商品,而商品是具体的物品。同样的,Python 的变量名就像是一个标签,它告诉我们这个变量指向的是什么对象,而对象是存储在内存中的具体数据。

对象与类型

**在 Python 中,几乎所有的数据都可以被视为对象,每一个对象都有其相应的类型。**例如:

print(type(123))  # <class 'int'>
print(type(3.14))  # <class 'float'>
print(type('hello'))  # <class 'str'>

**Python 是动态类型语言,我们不需要预先声明变量的类型。**在程序运行过程中,变量的类型可以根据赋值而改变。例如:

x = 123  # x 是一个整数
print(type(x))  # <class 'int'>
 
x = 'hello'  # x 变成了一个字符串
print(type(x))  # <class 'str'>

Python 中有两个内置函数 idtype

  • id(obj) 函数:返回对象 obj 的唯一标识符,其实质上是该对象在内存中的地址。
  • type(obj) 函数:返回对象 obj 的类型。

引用计数和垃圾收集

Python 不依赖存储期(即对象在内存中存在的时间)来管理变量和对象,而是使用引用计数。每个对象都会计算有多少个变量引用了它,当引用计数为 0 时,对象就会被垃圾收集器删除。可以使用内置的 id 函数获取对象的标识(这实际上是该对象的内存地址),使用 type 函数获取对象的类型。

# 引用计数和垃圾收集的例子:
# 在代码中,`sys.getrefcount(a)`可以获得对象`a`的引用计数。
# 当我们创建一个新的引用`b`时,`a`的引用计数增加1。
# 当我们删除`b`时,`a`的引用计数减少1。
 
import sys
 
a = []  # 创建一个空列表
 
print(sys.getrefcount(a))  # 输出:2,一个引用来自 a,一个来自 getrefcount 的参数
 
b = a  # 增加一个引用
 
print(sys.getrefcount(a))  # 输出:3,新增一个引用来自 b
 
b = None  # 删除一个引用
 
print(sys.getrefcount(a))  # 输出:2,b 不再引用

可变类型、不可变类型

Python 中的数据类型可以分为两大类:可变类型与不可变类型。

  • 可变类型:值可以更改,如列表、字典和集合。
  • 不可变类型:值不可更改,如数字、字符串、元组等。

不可变类型的变量如果改变值,实际上是生成了一个新的对象,并使变量引用新的对象。Python 的赋值语句复制的是对象的引用,而不是对象的值。因此,Python 中的“变量”与其他编程语言中的“变量”不完全相同,将其翻译为“引用”可能更加合适。

# 在代码中,`list1`是一个列表,是可变类型。
# 我们可以通过`append`方法修改`list1`,但是`list1`的`id`并未改变,说明`list1`还是同一个对象。
# `x`是一个整数,是不可变类型。当我们改变`x`的值时,`x`的`id`改变了,说明`x`现在是一个新的对象。
 
# 可变类型:列表
list1 = [1, 2, 3]
print(id(list1))  # 输出 list1 的 id
list1.append(4)  # 修改 list1
print(id(list1))  # id 没有改变
 
# 不可变类型:整数
x = 1
print(id(x))  # 输出 x 的 id
x = x + 1  # 修改 x
print(id(x))  # id 改变了

Python3 内置类型

Python 3 内置了多种数据类型,同时还内建了许多其他类型,如上下文管理器类型、模块、方法、代码对象、类型对象、内部对象等。

数字类型

数字类型主要用于存储和处理数值。这包括整数、浮点数、复数和布尔类型。

类型描述示例可变性
int整数,无论大小都可以是正数或负数。123, -456, 0不可变
float浮点数,包含小数部分的数字。3.14, -0.01, 9.0不可变
complex复数,包含实部和虚部的数字。1+2j, 3-4j不可变

布尔类型

类型描述示例可变性
bool布尔,表示真或假的值。True, False不可变

序列类型

序列类型是一种有序的元素集合,包括字符串、列表和元组。每个元素都有一个相应的索引,可以通过索引来访问。

类型描述示例可变性
str字符串,由零个或多个字符组成的文本。'hello', "world", ''不可变
list列表,由一系列按特定顺序排列的元素组成。[1, 'two', 3.0]可变
tuple元组,类似于列表,但元素不可更改。(1, 'two', 3.0)不可变

集合类型

集合类型是一个无序的元素集合,其中的元素都是唯一的。这包括集合和冻结集合。

类型描述示例可变性
set集合,一组无序的、不重复的元素。{1, 'two', 3.0}可变
frozenset不可变集合,类似于集合,但元素不可更改。frozenset({1, 'two', 3.0})不可变

映射类型

映射类型是一个存储键值对的元素集合,其中的键是唯一的。字典就是一个映射类型。

类型描述示例可变性
dict字典,包含键值对的数据结构。{'name': 'John', 'age': 25}可变

特殊类型

类型描述示例可变性
NoneType表示 None 的特殊类型。None不可变
EllipsisType表示省略的特殊类型,主要在切片和 NumPy 库中使用。Ellipsis...不可变
NotImplementedType表示未实现方法的特殊类型,主要在自定义比较方法中使用。NotImplemented不可变

二进制类型

类型描述示例可变性
bytes字节,包含零个或多个范围为 0x<256 的整数的不可变序列。b'hello', b'\x01\x02'不可变
bytearray字节数组,包含零个或多个范围为 0x<256 的整数的可变序列。bytearray(b'hello')可变
memoryview内存查看,用于访问其他二进制序列、打包的数组和缓冲区的内部数据。memoryview(b'hello')依据所查看对象

类、实例和异常

类型描述示例可变性
object对象,所有类的基类。obj = object()依据具体类
exception异常,程序运行时的错误。raise Exception('Error!')不可变

其他内置类型

类型描述示例可变性
function函数,包含一系列指令的代码块。def greet(): print('Hello!')不可变
type类型,表示对象的类型。type(123)不可变
generator生成器,一种可迭代的对象,由函数定义并使用 yield 产生值。(x**2 for x in range(10))不可变

类型转换

Python 提供了多种函数,用于在不同类型之间进行转换:

x = "123"  # 这是一个字符串
print(type(x))  # <class 'str'>
 
x = int(x)  # 将字符串转为整数
print(type(x))  # <class 'int'>
 
x = float(x)  # 将整数转为浮点数
print(type(x))  # <class 'float'>
函数描述
int(x [,base])将 x 转换为一个整数
float(x)将 x 转换到一个浮点数
complex(real [,imag])创建一个复数
str(x)将对象 x 转换为字符串
repr(x)将对象 x 转换为表达式字符串
eval(str)用来计算在字符串中的有效 Python 表达式,并返回一个对象
tuple(s)将序列 s 转换为一个元组
list(s)将序列 s 转换为一个列表
set(s)转换为可变集合
dict(d)创建一个字典。d 必须是一个 (key, value) 元组序列
frozenset(s)转换为不可变集合
chr(x)将一个整数转换为一个字符
ord(x)将一个字符转换为它的整数值
hex(x)将一个整数转换为一个十六进制字符串
oct(x)将一个整数转换为一个八进制字符串

运算符

在实际开发中,如果搞不清楚运算符的优先级,可以使用括号来确保运算的执行顺序

# 运算符
a = 10
b = 20
 
print(a + b)  # 加法,输出: 30
print(a - b)  # 减法,输出: -10
print(a * b)  # 乘法,输出: 200
print(a / b)  # 除法,输出: 0.5
print(a ** 2)  # 幂运算,输出: 100
print(a % 3)  # 取模,输出: 1
 
# 逻辑运算符
print(a > b)  # 大于,输出: False
print(a < b)  # 小于,输出: True
print(a == b)  # 等于,输出: False
print(a != b)  # 不等于,输出: True
 
# 成员运算符
s = 'Hello World'
print('World' in s)  # 输出: True
print('Python' not in s)  # 输出: True
运算符描述
[] [:]下标,切片
**指数
~ + -按位取反, 正负号
* / % //乘,除,模,整除
+ -加,减
>> <<右移,左移
&按位与
^ ``
<= < > >=小于等于,小于,大于,大于等于
== !=等于,不等于
is is not身份运算符
in not in成员运算符
not or and逻辑运算符
= += -= *= /= %= //= **= &= `=^=>>=“<`