07 | 修炼基本功:条件与循环

你好,我是景霄。

前面几节,我们一起学习了列表、元组、字典、集合和字符串等一系列Python的基本数据类型。但是,如何把这一个个基本的数据结构类型串接起来,组成一手漂亮的代码呢?这就是我们今天所要讨论的“条件与循环”。

我习惯把“条件与循环”,叫做编程中的基本功。为什么称它为基本功呢?因为它控制着代码的逻辑,可以说是程序的中枢系统。如果把写程序比作盖楼房,那么条件与循环就是楼房的根基,其他所有东西都是在此基础上构建而成。

毫不夸张地说,写一手简洁易读的条件与循环代码,对提高程序整体的质量至关重要。

条件语句

首先,我们一起来看一下Python的条件语句,用法很简单。比如,我想要表示y=|x|这个函数,那么相应的代码便是:

# y = |x|
if x < 0:
    y = -x
else:
    y = x

和其他语言不一样,我们不能在条件语句中加括号,写成下面这样的格式。

if (x < 0)

但需要注意的是,在条件语句的末尾必须加上冒号(:),这是Python特定的语法规范。

由于Python不支持switch语句,因此,当存在多个条件判断时,我们需要用else if来实现,这在Python中的表达是elif。语法如下:

if condition_1:
    statement_1
elif condition_2:
    statement_2
...
elif condition_i:
    statement_i
else:
    statement_n

整个条件语句是顺序执行的,如果遇到一个条件满足,比如condition_i满足时,在执行完statement_i后,便会退出整个if、elif、else条件语句,而不会继续向下执行。这个语句在工作中很常用,比如下面的这个例子。

实际工作中,我们经常用ID表示一个事物的属性,然后进行条件判断并且输出。比如,在integrity的工作中,通常用0、1、2分别表示一部电影的色情暴力程度。其中,0的程度最高,是red级别;1其次,是yellow级别;2代表没有质量问题,属于green。

如果给定一个ID,要求输出某部电影的质量评级,则代码如下:

if id == 0:
    print('red')
elif id == 1:
    print('yellow')
else:
    print('green')  

不过要注意,if语句是可以单独使用的,但elif、else都必须和if成对使用。

另外,在我们进行条件判断时, 不少人喜欢省略判断的条件,比如写成下面这样:

if s: # s is a string
    ...
if l: # l is a list
    ...
if i: # i is an int
    ...
... 

关于省略判断条件的常见用法,我大概总结了一下:

不过,切记,在实际写代码时,我们鼓励,除了boolean类型的数据,条件判断最好是显性的。比如,在判断一个整型数是否为0时,我们最好写出判断的条件:

if i != 0:
    ...

而不是只写出变量名:

if i:
    ...

循环语句

讲完了条件语句,我们接着来看循环语句。所谓循环,顾名思义,本质上就是遍历集合中的元素。和其他语言一样,Python中的循环一般通过for循环和while循环实现。

比如,我们有一个列表,需要遍历列表中的所有元素并打印输出,代码如下:

l = [1, 2, 3, 4]
for item in l:
    print(item)
1
2
3
4

你看,是不是很简单呢?

其实,Python中的数据结构只要是可迭代的(iterable),比如列表、集合等等,那么都可以通过下面这种方式遍历:

for item in <iterable>:
    ...

这里需要单独强调一下字典。字典本身只有键是可迭代的,如果我们要遍历它的值或者是键值对,就需要通过其内置的函数values()或者items()实现。其中,values()返回字典的值的集合,items()返回键值对的集合。

d = {'name': 'jason', 'dob': '2000-01-01', 'gender': 'male'}
for k in d: # 遍历字典的键
    print(k)
name
dob
gender

for v in d.values(): # 遍历字典的值
    print(v)
jason
2000-01-01
male    

for k, v in d.items(): # 遍历字典的键值对
    print('key: {}, value: {}'.format(k, v))
key: name, value: jason
key: dob, value: 2000-01-01
key: gender, value: male 

看到这里你也许会问,有没有办法通过集合中的索引来遍历元素呢?当然可以,其实这种情况在实际工作中还是很常见的,甚至很多时候,我们还得根据索引来做一些条件判断。

我们通常通过range()这个函数,拿到索引,再去遍历访问集合中的元素。比如下面的代码,遍历一个列表中的元素,当索引小于5时,打印输出:

l = [1, 2, 3, 4, 5, 6, 7]
for index in range(0, len(l)):
    if index < 5:
        print(l[index])        
        
1
2
3
4
5

当我们同时需要索引和元素时,还有一种更简洁的方式,那就是通过Python内置的函数enumerate()。用它来遍历集合,不仅返回每个元素,并且还返回其对应的索引,这样一来,上面的例子就可以写成:

l = [1, 2, 3, 4, 5, 6, 7]
for index, item in enumerate(l):
    if index < 5:
        print(item)  
              
1
2
3
4
5

在循环语句中,我们还常常搭配continue和break一起使用。所谓continue,就是让程序跳过当前这层循环,继续执行下面的循环;而break则是指完全跳出所在的整个循环体。在循环中适当加入continue和break,往往能使程序更加简洁、易读。

比如,给定两个字典,分别是产品名称到价格的映射,和产品名称到颜色列表的映射。我们要找出价格小于1000,并且颜色不是红色的所有产品名称和颜色的组合。如果不用continue,代码应该是下面这样的:

# name_price: 产品名称(str)到价格(int)的映射字典
# name_color: 产品名字(str)到颜色(list of str)的映射字典
for name, price in name_price.items():
    if price < 1000:
        if name in name_color:
            for color in name_color[name]:
                if color != 'red':
                    print('name: {}, color: {}'.format(name, color))
        else:
            print('name: {}, color: {}'.format(name, 'None'))

而加入continue后,代码显然清晰了很多:

# name_price: 产品名称(str)到价格(int)的映射字典
# name_color: 产品名字(str)到颜色(list of str)的映射字典
for name, price in name_price.items():
    if price >= 1000:
        continue
    if name not in name_color:
        print('name: {}, color: {}'.format(name, 'None'))
        continue
    for color in name_color[name]:
        if color == 'red':
            continue
        print('name: {}, color: {}'.format(name, color))

我们可以看到,按照第一个版本的写法,从开始一直到打印输出符合条件的产品名称和颜色,共有5层for或者if的嵌套;但第二个版本加入了continue后,只有3层嵌套。

显然,如果代码中出现嵌套里还有嵌套的情况,代码便会变得非常冗余、难读,也不利于后续的调试、修改。因此,我们要尽量避免这种多层嵌套的情况。

前面讲了for循环,对于while循环,原理也是一样的。它表示当condition满足时,一直重复循环内部的操作,直到condition不再满足,就跳出循环体。

while condition:
    ....

很多时候,for循环和while循环可以互相转换,比如要遍历一个列表,我们用while循环同样可以完成:

l = [1, 2, 3, 4]
index = 0
while index < len(l):
    print(l[index])
    index += 1

那么,两者的使用场景又有什么区别呢?

通常来说,如果你只是遍历一个已知的集合,找出满足条件的元素,并进行相应的操作,那么使用for循环更加简洁。但如果你需要在满足某个条件前,不停地重复某些操作,并且没有特定的集合需要去遍历,那么一般则会使用while循环。

比如,某个交互式问答系统,用户输入文字,系统会根据内容做出相应的回答。为了实现这个功能,我们一般会使用while循环,大致代码如下:

while True:
    try:
        text = input('Please enter your questions, enter "q" to exit')
        if text == 'q':
            print('Exit system')
            break
        ...
        ...
        print(response)
    except Exception as err:
        print('Encountered error: {}'.format(err))
        break 

同时需要注意的是,for循环和while循环的效率问题。比如下面的while循环:

i = 0
while i < 1000000:
    i += 1

和等价的for循环:

for i in range(0, 1000000):
    pass

究竟哪个效率高呢?

要知道,range()函数是直接由C语言写的,调用它速度非常快。而while循环中的“i += 1”这个操作,得通过Python的解释器间接调用底层的C语言;并且这个简单的操作,又涉及到了对象的创建和删除(因为i是整型,是immutable,i += 1相当于i = new int(i + 1))。所以,显然,for循环的效率更胜一筹。

条件与循环的复用

前面两部分讲了条件与循环的一些基本操作,接下来,我们重点来看它们的进阶操作,让程序变得更简洁高效。

在阅读代码的时候,你应该常常会发现,有很多将条件与循环并做一行的操作,例如:

expression1 if condition else expression2 for item in iterable

将这个表达式分解开来,其实就等同于下面这样的嵌套结构:

for item in iterable:
    if condition:
        expression1
    else:
        expression2

而如果没有else语句,则需要写成:

expression for item in iterable if condition

举个例子,比如我们要绘制y = 2*|x| + 5 的函数图像,给定集合x的数据点,需要计算出y的数据集合,那么只用一行代码,就可以很轻松地解决问题了:

y = [value * 2 + 5 if value > 0 else -value * 2 + 5 for value in x]

再比如我们在处理文件中的字符串时,常常遇到的一个场景:将文件中逐行读取的一个完整语句,按逗号分割单词,去掉首位的空字符,并过滤掉长度小于等于3的单词,最后返回由单词组成的列表。这同样可以简洁地表达成一行:

text = ' Today,  is, Sunday'
text_list = [s.strip() for s in text.split(',') if len(s.strip()) > 3]
print(text_list)
['Today', 'Sunday']

当然,这样的复用并不仅仅局限于一个循环。比如,给定两个列表x、y,要求返回x、y中所有元素对组成的元组,相等情况除外。那么,你也可以很容易表示出来:

[(xx, yy) for xx in x for yy in y if xx != yy]

这样的写法就等价于:

l = []
for xx in x:
    for yy in y:
        if xx != yy:
            l.append((xx, yy))

熟练之后,你会发现这种写法非常方便。当然,如果遇到逻辑很复杂的复用,你可能会觉得写成一行难以理解、容易出错。那种情况下,用正常的形式表达,也不失为一种好的规范和选择。

总结

今天这节课,我们一起学习了条件与循环的基本概念、进阶用法以及相应的应用。这里,我重点强调几个易错的地方。

  • 在条件语句中,if可以单独使用,但是elif和else必须和if同时搭配使用;而If条件语句的判断,除了boolean类型外,其他的最好显示出来。

  • 在for循环中,如果需要同时访问索引和元素,你可以使用enumerate()函数来简化代码。

  • 写条件与循环时,合理利用continue或者break来避免复杂的嵌套,是十分重要的。

  • 要注意条件与循环的复用,简单功能往往可以用一行直接完成,极大地提高代码质量与效率。

思考题

最后给你留一个思考题。给定下面两个列表attributes和values,要求针对values中每一组子列表value,输出其和attributes中的键对应后的字典,最后返回字典组成的列表。

attributes = ['name', 'dob', 'gender']
values = [['jason', '2000-01-01', 'male'], 
['mike', '1999-01-01', 'male'],
['nancy', '2001-02-01', 'female']
]

# expected output:
[{'name': 'jason', 'dob': '2000-01-01', 'gender': 'male'}, 
{'name': 'mike', 'dob': '1999-01-01', 'gender': 'male'}, 
{'name': 'nancy', 'dob': '2001-02-01', 'gender': 'female'}]

你能分别用一行和多行条件循环语句,来实现这个功能吗?

欢迎在留言区写下你的答案,还有你今天学习的心得和疑惑,也欢迎你把这篇文章分享给你的同事、朋友。

精选留言

  • yshan

    2019-05-24 01:25:32

    [(xx, yy) for xx in x for yy in y if x != y]
    应该是 if xx != yy] 吧
    思考题一行:
    [dict(zip(attributes,v)) for v in values]



    作者回复

    嗯嗯,笔误已更新。
    思考题👍

    2019-05-24 11:32:44

  • AllenGFLiu

    2019-05-25 09:18:19

    思考题
    一行版:
    [dict(zip(attributes, value)) for value in values]

    循环版:
    l = []
    for value in values:
    d = {}
    for i in range(3):
    d[attributes[i]] = value[i]
    l.append(d)


  • LiANGZE

    2019-05-24 02:17:49

    课后的练习题,手机打的,格式可能不好看

    print( [{ attributes[i]: value[i] for i in range(len(attributes)) } for value in values])
  • 呜呜啦

    2019-06-15 19:59:22

    attributes = ['name', 'dob', 'gender']
    values = [
    ['jason', '2000-01-01', 'male'],
    ['mike', '1999-01-01', 'male'],
    ['nancy', '2001-02-01', 'female']
    ]

    # 多行代码版
    list1 = [] # 建立空列表
    for value in values: # 对值列表进行循环
    dict1 = {} # 建立空字典,方便后续字典键值对存储
    for index,key in enumerate(attributes): # 遍历键列表,返回元素与索引
    dict1[key] = value[index] # 键与值配对,组装成字典元素
    list1.append(dict1) # 将新字典添加到里列表中
    print(list1) # 打印显示出完整列表

    # 一行代码版
    [{key:value[index] for index,key in enumerate(attributes)}for value in values]
    # 最外层[]与上面“list1=[]”和“list1.append(dict1)”等价
    # "{key:value[index] for index,key in enumerate(attributes)}"与上面"for value in values:"内代码等价
    # 体会:先梳理逻辑,写出多行代码版,再回溯写出一行代码版,体现出Python的简洁优美
  • Fergus

    2019-05-26 18:09:04

    # Ask
    attributes = ['name', 'dob', 'gender']
    values = [['jason', '2000-01-01', 'male'],
    ['mike', '1999-01-01', 'male'],
    ['nancy', '2001-02-01', 'female']]
    # Answers1
    lis = []
    for i in values:
    print(i)
    print(dict(zip(attributes, i)))
    print(lis.append(dict(zip(attributes, i))))
    # Answers2
    [dict(zip(attributes, i)) for i in values]
    # Answers3
    list(map(lambda x: dict(zip(attributes, x)), values))
    # Answers4
    lis = []
    for i in values:
    dic = {}
    for n, j in enumerate(i):
    dic[attributes[n]] = j
    lis.append(dic)
    print(lis)

    我没有想到用多行条件循环语句实现的方法。先留言,然后看别人怎么做的。
  • Deed

    2019-05-24 11:49:22

    [dict(zip(attributes, value)) for value in values]
  • 橙子冰

    2019-12-19 10:23:20

    编程本身占用不了太多时间,主要的时间是花在逻辑的设计,我觉得尽量不要把代码写在一行,增加阅读的难度
  • 隰有荷

    2019-06-08 14:49:35

    zip函数感觉好神奇,得差一下,哈哈
  • 武林秀才

    2019-05-28 12:33:25

    一行的
    [dict([(attributes[j],values[i][j]) for j in range(len(attributes))]) for i in range(len(values))]
  • 夜月不挂科

    2019-05-27 10:48:18

    [dict(map(lambda x, y:(x, y), attributes, value)) for value in values]
  • 夜雨声烦

    2019-09-17 00:17:10

    作业:使用zip函数将两个list聚合成一个元祖,然后再转换成字典:
    bb = [dict(zip(attributes,va)) for va in values]
  • 小希

    2019-11-27 15:32:22

    通过反复查看文章内容跟参考留言中的评论,理解后输出。
    虽然不是自己写的,也算是对自己的一种鼓励,至少清楚了逻辑。
    #一行
    print ([dict(zip(attributes,value))for value in values])

    #多行输出
    list1 = [] #建议空列表
    for value in values: #对值列表进行循环
    dict1 = {} #简历空字典,后续对字典键值对存储
    for index ,key in enumerate(attributes):#遍历建列表,返回索引与元素
    dict1[key] = value[index] #键与值匹配对,组装成字典元素
    list1.append(dict1) #将字典添加到列表中
    print(list1)
    作者回复

    加油

    2019-11-28 16:54:11

  • Wing·三金

    2019-05-27 11:22:13

    # 多行版本
    combined = []
    for value in values:
    temp_dict = {}
    for index, attr in enumerate(attributes):
    temp_dict[attr] = value[index]
    combined.append(temp_dict)

    combined

    # 单行版本
    [{attr: value[index] for index, attr in enumerate(attributes)} for value in values]
  • k8scloud

    2019-05-26 10:29:06

    attributes = ['name','dob','gender']
    values = [['jason','2000-1-01','male'],['mike','1999-01-1','male'],['nancy','201-02-01','female']]
    output = []
    for v in values:
    dst = {}
    for k in range(len(v)):
    dst[attributes[k]] = v[k]
    output.append(dst)
    print(output)
  • rs勿忘初心

    2021-09-27 10:21:44

    一行代码:
    [dict(zip(attributes, value)) for value in values]

    Ps:
    zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。
    如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。

    示例:
    >>> a = [1, 2, 3]
    >>> b = [4, 5, 6]
    >>> c = [4, 5, 6, 7, 8]
    >>> zipped = zip(a, b) # 打包为元组的列表
    [(1, 4), (2, 5), (3, 6)]
    >>> zip(a, c) # 元素个数与最短的列表一致
    [(1, 4), (2, 5), (3, 6)]
    >>> zip(*zipped) # 与 zip 相反,*zipped 可理解为解压,返回二维矩阵式
    [(1, 2, 3), (4, 5, 6)]
  • Geek_David

    2020-03-26 19:37:49

    同意老师的说法,逻辑相对简单的可以一句搞定,逻辑越复杂越不要一句搞定,会很难理解
  • 向南

    2020-03-06 17:53:45

    ```python
    attributes = ['name', 'dob', 'gender']
    values = [['jason', '2000-01-01', 'male'],
    ['mike', '1999-01-01', 'male'],
    ['nancy', '2001-02-01', 'female']
    ]

    d = []
    for value in values:
    d.append(dict(zip(attributes, value)))

    print(d)

    xx = [dict(zip(attributes, v)) for v in values]
    print(xx)
    ```
  • 易拉罐

    2019-06-03 10:51:41

    # general.
    expected_output = []
    for v in values:
    expected_output.append(dict(zip(attributes, v)))
    print(expected_output)

    # one line
    print([dict(zip(attributes, v)) for v in values])
  • 夏秋冬的春天

    2019-05-31 01:16:18

    # 多行
    output_dist = []
    for v in values:
    dict_at = {}
    for i in range(len(attributes)):
    dict_at[attributes[i]] = v[i]
    output_dist.append(dict_at)
    print(output_dist)

    # 一行
    print( [{ attributes[i]: value[i] for i in range(len(attributes)) } for value in values])
  • 夜下凝月

    2019-05-25 08:54:15

    Python中没有switch,但是可以用字典来代替。
    #不调用函数
    level = {0:'red', 1:'yellow', 2:'green'}
    try:
    level(id)
    except:
    pass

    #需要调用函数
    def delete (id):
    '''delete the movie that id is 0'''
    ………
    ………
    ………
    ………
    opt = {0:delete, 1:warning, 2:allow}

    opt[ id ]( id )