python 对于初学者来说是一门优秀的语言,但这并不意味着就不会犯错误。 尤其是在学习编程的早期阶段,很容易编写出技术上正确但风格上很差的代码。
如果您要学习编码,那么学好它是至关重要的。 无论是在学术界还是工业界,代码的质量都很重要。 它不仅会影响您,还会影响将继续阅读和使用您的代码的每一个人。 也许更自私的是,它还会影响您的招聘前景。
在本文中,我将讨论介绍性 python 程序员常犯的四个错误。 在我早期的 python 时代学习这些陷阱对我非常有帮助,我希望它也能对你有用。
让我们开始吧。
布尔条件语句这是入门程序员常犯的错误。 这也是不那么入门的程序员所犯的错误,他们缺乏正式的编程背景,因为他们只是将代码用作工具。 我在看着你,数据科学家。
python 中的条件语句很有用,但并不总是必需的。 当您检查的条件已经包含布尔值(真或假)时,尤其如此。
让我用一个简单的例子来说明。 假设我们要编写代码来确定一个数据集是否已经被清理过。 对我们来说幸运的是,代码库包含一个名为 is_data_clean 的方便变量,它可以跟踪这一点。 我们需要做的就是检查它并返回正确的值。
作为第一次尝试,我们可能会编写如下内容:
def a_function():
if is_data_clean == true:
return true
else:
return false
这已经可以运行了,但它不必如此复杂。 你看到问题了吗? 仔细看。
变量 is_data_clean 已经是一个布尔值; 因此,它已经包含了您需要返回的值! 代码检查它是否为 true,然后返回 true,如果它不是 true(意味着它为 false),则代码返回 false。 这只是一大堆不必要的检查。
我们可以将函数中的代码简化为一行:
def a_function():
return is_data_clean
好多了。
手动求和、均值或其他内置操作python 具有比大多数人意识到的更多的内置功能。 仍然使用循环来手动计算总和的人数实在是太多了。
如果我们在 python 中有一个数字列表,我们绝对不应该像这样计算总和:
total = 0
for num in numbers_list:
total += num
请改用内置的求和函数:
total
需要最小值还或最大值? 全宇宙都禁止你写这样的代码:
import math
minimum = math.inf # 从最高可能值开始
for number in numbers_list:
if number < minimum:
minimum = number
这不是介绍性的计算机科学原理课程; 这是真实的世界。 停止重新发明轮子并使用内置的 min 和 max 函数:
minimum = min(numbers_list)
maximum
有关内置函数的完整列表,请参阅 python 文档
奖励:技术上不是内置的内置功能。
有些功能很难找到,但这并不意味着您不应该找到它们。
例如,如果我们需要一列数字的平均值(您可能会感觉到这是反复出现的主题),我们可以使用下面的第一个代码片段,但我们应该使用第二个:
# 片段 1:不要这样做!
total = 0
for num in numbers_list:
total += num
avg = total / len(numbers_list)
# 片段 2:这样做!
import numpy as np
avg = np.mean(numbers_list)
通常,python 会在模块中提供有用的函数。 定位我们需要的模块并导入函数可能需要一些额外的工作,但非常值得。
请记住 — python 就是简单性和可读性。 内置函数是你的朋友。 与你的人类朋友不同,他们永远不会让人失望。
不做无意义的事情在我教授的一门 python 入门课程中,学生的第一个项目是编写一个简单的决策算法。 这主要是一个条件练习,要求学生定义一个问题和相关的评分系统,以确定某人有资格回答这个问题的可能性。
例如,有人可能会问,“我应该成为一名数据科学家吗?” 然后,该算法可能包含以下问题,所有这些问题都会根据答案从最终输出分数中增加或减少:
我是否有兴趣使用数据来深入了解世界?我愿意学习 python 吗?我喜欢与多学科团队合作吗?等等。
在编写算法的过程中,许多学生意识到在某些情况下,他们根本不想对总分做任何事情。 例如,他们可能会决定,如果有人愿意学习 python,那么他们的总分会增加 10 分,但如果他们不愿意,则分数保持不变。
大多数学生使用以下代码实现它:
# willing_to_lean 是一些基于用户输入的预定义变量
if willing_to_learn:
score += 10
else:
score += 0
这是什么都不做的经典案例。 让我们分解一下 python 在看到代码行 score += 0 时必须执行的所有操作:
它需要查找变量 score 的值。它需要将 0 添加到该值。 这需要调用加法函数,传入两个参数(当前值和 0),并计算输出。将 score 变量重新分配给新值(显然是相同的)。所有这些代码什么都不做。
当然,这对计算机来说不是很大的工作量,也不会对代码的效率产生任何有意义的影响。 也就是说,它毫无意义,而且有些不干净,这是优秀 python 代码所不具备的特征。
更好的解决方案是使用 python 的 pass 关键字,它实际上告诉 python 什么都不做,继续前进。 它填充了一行不需要的代码,但如果完全留空就会出错。 我们甚至可以添加一点评论以提供进一步的清晰度:
if willing_to_learn:
score += 10
else:
pass # 保持分数不变
更干净、更清晰、更 pythonic。
单一的条件变得疯狂条件语句可以说是标准编程中最强大和一致的结构之一。 第一次学习它时,很容易忽略一个重要的微妙之处。
当我们要检查两个或多个条件时,就会出现这种情况。 例如,假设我们正在审查一项调查,以获取以下三种形式之一的回答:“yes”、“no”或“maybe”。
早期的 python 程序员通常使用以下两种方式之一对此进行编码:
# 可能 1
if response == yes:
# do something
if response == no:
# do something
if response == maybe:
# do something
# 可能 2
if response == yes:
# do something
elif response == no:
# do something
else:
# do something
在这种情况下,这两个代码片段实际上是相同的。 它们的行为方式相同,理解起来并不特别混乱,并且它们实现了预期的目标。 当人们错误地认为上面的两个结构总是等价时,问题就出现了。
这是错误的。 上面的第二个代码片段是由多个部分组成的单个条件表达式,而第一个代码片段由三个独立的条件表达式组成,尽管它们看起来是相互关联的。
为什么这很重要? 因为每当 python 看到一个全新的 if 关键字(即一个新的条件表达式开始)时,它就会检查关联的条件。 另一方面,如果当前条件表达式中的先前条件不满足,python 只会输入 elif 或 else 条件。
让我们看一个例子,看看为什么这很重要。 假设我们需要编写代码,根据学生在某项作业中的分数给他们打分。 我们在python 文件中写入以下代码:
score = 76
print(snippet 1)
print()
if score < 100:
print('a')
elif score < 90:
print('b')
elif score < 80:
print('c')
elif score < 70:
print('d')
else:
print('f')
print()
print(snippet 2)
print()
if score < 100:
print('a')
if score < 90:
print('b')
if score < 80:
print('c')
if score < 70:
print('d')
if score < 60:
print('f')
运行此代码输出以下内容:
snippet 1
a
snippet 2
a
b
c
你看得到差别吗? 在第二种情况下,我们得到了意想不到的输出。 为什么? 因为 python 将每个 if 语句作为一个新的条件来读取,所以如果一个分数恰好小于多个数字检查,则会为所有这些打印出相应的字母等级。
现在,有多种方法可以使用多个 if 语句; 例如,我们可以让条件检查范围而不仅仅是上限。 这个例子的重点不是争论一个例子优于另一个例子(尽管为了清楚起见,我个人倾向于使用 elif 和 else),而只是为了说明它们是不一样的。
确保你明白这一点。
最后的想法和回顾这是您的 python 初学者备忘单:
当您可以简单地直接返回布尔值时,不要为布尔值设置不必要的条件。内置函数是您最好的朋友。如果您需要告诉 python 什么都不做,请使用 pass 关键字。确保正确构造条件表达式,理解 if 、 elif 和 else 关键字的含义。你决定学习 python 真是太好了——我向你保证,这门语言会对你很好。
以上就是初学 python 应避免的四个常见错误的详细内容。