循环执行速度慢怎么办 - 提升代码效率的实用方法

循环 执行速度慢的常见原因

写代码时，经常遇到循环跑得特别慢的情况。比如处理上万条日志数据时，一个 for 循环卡了十几秒，用户体验直接崩了。这种情况在网络安全脚本中尤其明显，像批量检测 IP 是否开放、分析流量包特征等任务，一旦循环效率低，整个工具就变得不实用。

问题往往出在循环体内做了太多重复操作，或者数据结构选择不当。比如每次循环都去读文件、做网络请求，甚至反复计算同一个值，这些都会拖慢速度。

把不变的计算提到循环外面。例如，下面这段 Python 代码就很典型：

for i in range(len(data)):
    result = expensive_function() * 2
    process(data[i] + result)

这里 expensive_function() 每次都调用，其实结果是一样的。应该改成：

result = expensive_function() * 2
for item in data:
    process(item + result)

这样只算一次，性能立马提升。

在循环里用 in 判断列表是否包含某元素，复杂度是 O(n)，数据一多就卡。比如检查一批 IP 是否在黑名单中：

for ip in incoming_ips:
    if ip in blacklist_list:  # 黑名单是 list
        block(ip)

换成集合（set），查找变成 O(1)：

blacklist_set = set(blacklist_list)
for ip in incoming_ips:
    if ip in blacklist_set:
        block(ip)

成千上万次判断，差距非常明显。

Python 的 map()、filter() 或列表推导式通常比手动 for 循环快，因为底层是 C 实现的。比如过滤异常登录行为：

abnormal_logs = [log for log in logs if log['status'] == 404]

比写一个空列表加 append 要高效。再进一步，如果数据量大，可以用生成器避免一次性加载：

def get_abnormal(logs):
    for log in logs:
        if log['status'] == 404:
            yield log

内存占用小，适合处理大型日志文件。

有些任务本身可以拆开跑。比如扫描多个目标端口，完全可以用多线程或进程加速：

from concurrent.futures import ThreadPoolExecutor

with ThreadPoolExecutor(max_workers=10) as executor:
    executor.map(scan_port, targets)

注意：I/O 密集型任务用多线程，CPU 密集型考虑多进程。网络安全工具中多数是发请求、收响应，属于 I/O 操作，线程足够应付。

有时候不是代码写得差，而是选错了语言或库。比如用 Python 处理超大规模数据包分析，就算优化到极致也拼不过 C 写的工具。这时候不妨用 Scapy 做原型，核心部分交给 dpdk 或 libpcap 类库处理。

另外，加个简单缓存也能省不少时间。比如 DNS 查询结果缓存几分钟，避免重复解析同一个域名，这对爬虫类安全检测特别有用。