python中必须掌握的20个核心函数——list()/dict()/set()

以下是Python中list()、dict()和set()三大核心容器函数的全面对比解析,涵盖创建方式、特性差异、应用场景及性能考量:

一、核心概念对比

特性

list()

dict()

set()

数据结构

有序可变序列

键值对映射

无序唯一元素集合

元素要求

任意类型

键必须可哈希(不可变类型)

元素必须可哈希

空对象创建

list() 或 []

dict() 或 {}

set()({}是字典)

重复元素

允许

键唯一,值可重复

自动去重

查询效率

O(n)

O(1)(键查询)

O(1)(成员检测)


二、创建方式对比

1. 空容器创建

empty_list = list()    # 或 []
empty_dict = dict()    # 或 {}
empty_set = set()      # 注意:{}创建的是空字典

2. 从可迭代对象创建

# list() - 保留所有元素
list("abc")            # ['a', 'b', 'c']
list(range(3))         # [0, 1, 2]

# dict() - 根据输入类型处理
dict([('a',1),('b',2)]) # {'a':1, 'b':2}
dict(zip(['a','b'], [1,2])) # {'a':1, 'b':2}

# set() - 自动去重
set("hello")           # {'h', 'e', 'l', 'o'}
set([1,2,2,3])         # {1, 2, 3}

3. 特殊初始化方式

# 列表推导式
[x*2 for x in range(3)] # [0, 2, 4]

# 字典推导式
{x: x**2 for x in range(3)} # {0:0, 1:1, 2:4}

# 集合推导式
{x%3 for x in range(10)} # {0, 1, 2}

三、核心操作对比

1. 增删改查

# List - 基于索引
lst = [1, 2]
lst.append(3)          # [1, 2, 3]
lst[1] = 99            # [1, 99, 3]

# Dict - 基于键
d = {'a':1}
d['b'] = 2             # {'a':1, 'b':2}
del d['a']             # {'b':2}

# Set - 基于元素
s = {1, 2}
s.add(3)               # {1, 2, 3}
s.discard(2)           # {1, 3}

2. 成员检测效率

# 示例:处理有序数据
timestamps = [1630000000, 1630000001, 1630000001]

2.dict()适用场景

  • 键值映射(如配置信息)
  • 快速查找表(如缓存)
  • 统计频次(如词频统计)
# 示例:词频统计
text = "apple banana apple"
counts = {}
for word in text.split():
    counts[word] = counts.get(word, 0) + 1
# {'apple':2, 'banana':1}

3.set()适用场景

  • 去重(如用户ID处理)
  • 集合运算(如共同好友)
  • 快速成员检测(如屏蔽词过滤)
# 示例:查找共同元素
admins = {"Alice", "Bob"}
online_users = {"Bob", "Charlie"}
admins_online = admins & online_users  # {'Bob'}

五、性能优化技巧

  1. 预分配空间
# List
lst = [None] * 1000  # 预分配比append快

# Dict
d = dict.fromkeys(range(1000))  # 快速初始化

选择合适容器

  • 频繁查询 → set/dict
  • 需要顺序 → list/OrderedDict

批量操作

# 比循环add更快
s.update([4,5,6])
d.update({'c':3, 'd':4})

六、互相转换

# List → Set(去重)
unique = set([1,2,2,3])  # {1,2,3}

# Dict → List(获取键/值)
keys = list({'a':1, 'b':2})  # ['a','b']

# Set → List
lst = list({1,2,3})  # [1,2,3](顺序不保证)

七、总结决策表

需求

推荐容器

理由

保持顺序,允许重复

list

有序索引访问

键值映射,快速查找

dict

O(1)键查询

去重,集合运算

set

自动去重,高效成员检测

内存敏感的大型数据集

set/dict

哈希表存储更节省空间

掌握这三种容器的特性差异,能够帮助您:

  • 根据场景选择最优数据结构
  • 编写更高效的Python代码
  • 合理解决去重、查找、排序等问题
  • 优化程序内存和计算性能
原文链接:,转发请注明来源!