网站首页 > 厂商资讯 > 禾蛙 >

defaultdict(int)与普通字典有何区别？

在Python编程中，字典是一种常用的数据结构，用于存储键值对。然而，对于一些特定场景，普通字典可能存在一些局限性。在这种情况下，defaultdict作为一种特殊的字典类型，可以提供更加便捷和强大的功能。本文将深入探讨defaultdict(int)与普通字典的区别，帮助读者更好地理解和使用这两种数据结构。

1. 默认值设定

在普通字典中，如果尝试访问一个不存在的键，程序会抛出KeyError异常。而defaultdict允许用户为字典指定一个默认值，当访问一个不存在的键时，会自动创建该键，并将其值设置为默认值。

例如，使用普通字典：

d = {}

d['a'] = 1

print(d['a'])  # 输出：1

print(d['b'])  # 抛出KeyError异常

使用defaultdict(int)：

from collections import defaultdict



d = defaultdict(int)

d['a'] = 1

print(d['a'])  # 输出：1

print(d['b'])  # 输出：0，因为默认值为int类型0

2. 默认值类型

在defaultdict(int)中，默认值类型为int。这意味着，当创建一个defaultdict(int)时，所有不存在的键都会被自动初始化为int类型的默认值。而普通字典则没有这种限制，可以存储任意类型的值。

例如：

from collections import defaultdict



d = defaultdict(int)

d['a'] = 'hello'

print(d['a'])  # 输出：hello



d = {}

d['a'] = 'hello'

print(d['a'])  # 输出：hello

在上面的例子中，defaultdict(int)和普通字典都可以存储字符串类型的值。

3. 代码简洁性

由于defaultdict可以自动为不存在的键设置默认值，因此在编写代码时，可以省去一些冗余的判断和初始化操作，使代码更加简洁。

例如，在计算一组数的平均值时，可以使用defaultdict来统计每个数的出现次数：

from collections import defaultdict



nums = [1, 2, 3, 1, 2, 3, 1, 2, 3]

d = defaultdict(int)

for num in nums:

    d[num] += 1



print(d)  # 输出：defaultdict(, {1: 3, 2: 3, 3: 3})

在上面的例子中，使用defaultdict(int)可以避免在每次循环中判断键是否存在于字典中。

4. 应用场景

defaultdict在许多场景下都非常实用，以下是一些常见的应用场景：

计数统计：如上述例子，统计一组数的出现次数。
累加操作：如计算一组数的总和。
分组数据：将数据根据某个属性进行分组。

5. 案例分析

假设有一个班级的成绩数据，包括学生的姓名和成绩。现在需要统计每个学生的成绩分布情况。

使用普通字典：

scores = {

    'Alice': 90,

    'Bob': 85,

    'Charlie': 95,

    'David': 80

}



# 统计成绩分布

grade_dist = {}

for name, score in scores.items():

    if score >= 90:

        grade_dist['A'] = grade_dist.get('A', 0) + 1

    elif score >= 80:

        grade_dist['B'] = grade_dist.get('B', 0) + 1

    elif score >= 70:

        grade_dist['C'] = grade_dist.get('C', 0) + 1

    elif score >= 60:

        grade_dist['D'] = grade_dist.get('D', 0) + 1

    else:

        grade_dist['F'] = grade_dist.get('F', 0) + 1



print(grade_dist)  # 输出：{'A': 1, 'B': 1, 'C': 1, 'D': 1, 'F': 0}

使用defaultdict：

from collections import defaultdict



scores = {

    'Alice': 90,

    'Bob': 85,

    'Charlie': 95,

    'David': 80

}



# 统计成绩分布

grade_dist = defaultdict(int)

for name, score in scores.items():

    if score >= 90:

        grade_dist['A'] += 1

    elif score >= 80:

        grade_dist['B'] += 1

    elif score >= 70:

        grade_dist['C'] += 1

    elif score >= 60:

        grade_dist['D'] += 1

    else:

        grade_dist['F'] += 1



print(grade_dist)  # 输出：defaultdict(, {'A': 1, 'B': 1, 'C': 1, 'D': 1, 'F': 0})

通过比较两种方法，可以看出使用defaultdict可以使代码更加简洁和易于理解。