用于自动化的 10 个杀手级 Python 脚本
您是否厌倦了在繁琐的任务上浪费时间?
您是否梦想着一个计算机为您完成所有工作的世界?别无所求,因为我们有 5 个 Python 脚本,准备好告别体力劳动,自动化开始吧!
“自动化不是人类工人的敌人,而是盟友。自动化将工人从苦差事中解放出来,让他有机会做更有创造力和更有价值的工作。
阅读本文后,您将更好地了解许多类型的python脚本,您可以使用这些脚本来自动执行日常无聊的任务。
Python是一种功能强大的语言,广泛用于自动化各种任务。无论您是开发人员、系统管理员,还是只是想通过自动执行日常任务来节省时间的人,Python 都能满足您的需求。
1、文件传输脚本:
Python 中的文件传输脚本是一组用 Python 编程语言编写的指令或程序,用于自动执行通过网络或在计算机之间传输文件的过程。
Python 提供了几个可用于创建文件传输脚本的库和模块,例如套接字、ftplib、smtplib 和 paramiko 等。
下面是 Python 中一个简单的文件传输脚本示例,该脚本使用套接字模块通过网络传输文件:
importsocket
#createsocket
s=socket.socket()
#bindsockettoaaddressandport
s.bind(('localhost',12345))
#putthesocketintolisteningmode
s.listen(5)
print('Serverlistening...')
#foreverlooptokeepserverrunning
whileTrue:
#establishconnectionwithclient
client,addr=s.accept()
print(f'Gotconnectionfrom{addr}')
#receivethefilename
file_name=client.recv(1024).decode()
try:
#openthefileforreadinginbinary
withopen(file_name,'rb')asfile:
#readthefileinchunks
whileTrue:
chunk=file.read(1024)
ifnotchunk:
break
#sendthechunktotheclient
client.sendall(chunk)
print(f'File{file_name}sentsuccessfully')
exceptFileNotFoundError:
#iffilenotfound,sendappropriatemessage
client.sendall(b'Filenotfound')
print(f'File{file_name}notfound')
#closetheclientconnection
client.close()
此脚本运行一个服务器,该服务器侦听地址 localhost 和端口 12345 上的传入连接。当客户端连接时,服务器从客户端接收文件名,然后读取文件的内容并将其以块的形式发送到客户端。如果未找到该文件,服务器将向客户端发送相应的消息。
如上所述,还有其他库和模块可用于在python中创建文件传输脚本,例如使用ftp协议连接和传输文件的ftplib和用于SFTP(SSH文件传输协议)传输的paramiko。 可以定制脚本以匹配特定要求或方案。
2、系统监控脚本:
系统监视脚本是一种 Python 脚本,用于监视计算机或网络的性能和状态。该脚本可用于跟踪各种指标,例如 CPU 使用率、内存使用率、磁盘空间、网络流量和系统正常运行时间。该脚本还可用于监视某些事件或条件,例如错误的发生或特定服务的可用性。例如:
importpsutil
#GetthecurrentCPUusage
cpu_usage=psutil.cpu_percent()
#Getthecurrentmemoryusage
memory_usage=psutil.virtual_memory().percent
#Getthecurrentdiskusage
disk_usage=psutil.disk_usage("/").percent
#Getthenetworkactivity
#Getthecurrentinput/outputdataratesforeachnetworkinterface
io_counters=psutil.net_io_counters(pernic=True)
forinterface,countersinio_counters.items():
print(f"Interface{interface}:")
print(f"bytessent:{counters.bytes_sent}")
print(f"bytesreceived:{counters.bytes_recv}")
#Getalistofactiveconnections
connections=psutil.net_connections()
forconnectioninconnections:
print(f"{connection.laddr}{connection.raddr}({connection.status})")
#Printthecollecteddata
print(f"CPUusage:{cpu_usage}%")
print(f"Memoryusage:{memory_usage}%")
print(f"Diskusage:{disk_usage}%")
此脚本使用 psutil 模块中的cpu_percent、virtual_memory和disk_usage函数分别检索当前 CPU 使用率、内存使用率和磁盘使用率。
virtual_memory 函数返回具有各种属性的对象,例如内存总量以及已用内存量和可用内存量。
disk_usage 函数将路径作为参数,并返回具有磁盘上总空间量以及已用空间量和可用空间量等属性的对象。
3、网页抓取脚本,最常用: 此脚本可用于从网站中提取数据并以结构化格式(如电子表格或数据库)存储数据。这对于收集数据进行分析或跟踪网站上的更改非常有用。例如:
importrequests
frombs4importBeautifulSoup
#Fetchawebpage
page=requests.get("http://www.example.com")
#ParsetheHTMLcontent
soup=BeautifulSoup(page.content,"html.parser")
#Findallthelinksonthepage
links=soup.find_all("a")
#Printthelinks
forlinkinlinks:
print(link.get("href"))
在这里,您可以看到美丽汤包装的强大功能。您可以使用此包找到任何类型的 dom 对象,因为我已经展示了如何找到页面上的所有链接。
您可以修改脚本以抓取其他类型的数据,或导航到站点的不同页面。还可以使用 find 方法查找特定元素,或使用带有其他参数的 find_all 方法来筛选结果。
4、电子邮件自动化脚本:
此脚本可用于根据特定条件自动发送电子邮件。例如,您可以使用此脚本向团队发送每日报告,或者在重要截止日期临近时向自己发送提醒。下面是如何使用 Python 发送电子邮件的示例:
importsmtplib
fromemail.mime.textimportMIMEText
#SettheSMTPserverandlogincredentials
smtp_server="smtp.gmail.com"
smtp_port=587
username="your@email.com"
password="yourpassword"
#Settheemailparameters
recipient="recipient@email.com"
subject="TestemailfromPython"
body="ThisisatestemailsentfromPython."
#Createtheemailmessage
msg=MIMEText(body)
msg["Subject"]=subject
msg["To"]=recipient
msg["From"]=username
#Sendtheemail
server=smtplib.SMTP(smtp_server,smtp_port)
server.starttls()
server.login(username,password)
server.send_message(msg)
server.quit()
此脚本使用 smtplib 和电子邮件模块通过简单邮件传输协议 SMTP 发送电子邮件。
来自smtplib模块的SMTP类用于创建SMTP客户端,starttls和登录方法用于建立安全连接,电子邮件模块中的MIMEText类用于创建多用途Internet邮件扩展MIME格式的电子邮件。
MIMEText 构造函数将电子邮件的正文作为参数,您可以使用 setitem 方法来设置电子邮件的主题、收件人和发件人。
创建电子邮件后,SMTP 对象的send_message方法将用于发送电子邮件。然后调用 quit 方法以关闭与 SMTP 服务器的连接。
5、密码管理器脚本:
密码管理器脚本是一种用于安全存储和管理密码的 Python 脚本。该脚本通常包括用于生成随机密码、将哈希密码存储在安全位置(如数据库或文件)以及在需要时检索密码的函数。
importsecrets
importstring
#Generatearandompassword
defgenerate_password(length=16):
characters=string.ascii_letters+string.digits+string.punctuation
password="".join(secrets.choice(characters)foriinrange(length))
returnpassword
#Storeapasswordinasecureway
defstore_password(service,username,password):
#Useasecurehashingfunctiontostorethepassword
hashed_password=hash_function(password)
#Storethehashedpasswordinadatabaseorfile
withopen("password_database.txt","a")asf:
f.write(f"{service},{username},{hashed_password}\n")
#Retrieveapassword
defget_password(service,username):
#Lookupthehashedpasswordinthedatabaseorfile
withopen("password_database.txt")asf:
forlineinf:
service_,username_,hashed_password_=line.strip().split(",")
ifservice==service_andusername==username_:
#Useasecurehashingfunctiontocomparethestoredpasswordwiththeprovidedpassword
ifhash_function(password)==hashed_password_:
returnpassword
returnNone
上述示例脚本中的 generate_password 函数使用字母、数字和标点字符的组合生成指定长度的随机密码。
store_password函数将服务,如网站或应用程序、用户名和密码作为输入,并将散列密码存储在安全位置。
get_password函数将服务和用户名作为输入,如果在安全存储位置找到相应的密码,则检索相应的密码。
自动化的 Python 脚本的第 2 部分
欢迎回来!
在上一篇文章中,我们深入研究了 Python 脚本的世界,我们还没有揭开Python脚本的所有奥秘。
在本期中,我们将发现其余五种类型的脚本,这些脚本将让您立即像专业人士一样编码。
6、自动化数据分析:
Python的pandas是数据分析和操作的强大工具。以下脚本演示如何使用它自动执行清理、转换和分析数据集的过程。
importpandasaspd
#ReadingaCSVfile
df=pd.read_csv("data.csv")
#Cleaningdata
df.dropna(inplace=True)#Droppingmissingvalues
df=df[df["column_name"]!="some_value"]#Removingspecificrows
#Transformingdata
df["column_name"]=df["column_name"].str.lower()#Changingstringtolowercase
df["column_name"]=df["column_name"].astype(int)#Changingcolumndatatype
#Analyzingdata
print(df["column_name"].value_counts())#Printsthefrequencyofuniquevaluesinthecolumn
#SavingthecleanedandtransformeddatatoanewCSVfile
df.to_csv("cleaned_data.csv",index=False)
上面脚本中的注释对于具有 python 基础知识的人来说非常简单。
该脚本是一个简单的示例,用于演示 pandas 库的强大功能以及如何使用它来自动执行数据清理、转换和分析任务。
但是,脚本是有限的,在实际方案中,数据集可能要大得多,清理、转换和分析操作可能会更复杂。
7、自动化计算机视觉任务: 自动化计算机视觉任务是指使用 Python 及其库自动执行各种图像处理和计算机视觉操作。Python 中最受欢迎的计算机视觉任务库之一是 opencv。
OpenCV是一个主要针对实时计算机视觉的编程函数库。它提供了广泛的功能,包括图像和视频 I/O、图像处理、视频分析、对象检测和识别等等。例如:
importcv2
#Loadthecascadeclassifierforfacedetection
face_cascade=cv2.CascadeClassifier("haarcascade_frontalface_default.xml")
#Loadtheimage
img=cv2.imread("image.jpg")
gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
#Detectfaces
faces=face_cascade.detectMultiScale(gray,scaleFactor=1.1,minNeighbors=5)
#Drawrectanglesaroundthefaces
for(x,y,w,h)infaces:
cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2)
#Showtheimage
cv2.imshow("Faces",img)
cv2.waitKey(0)
cv2.destroyAllWindows()
上面的脚本检测图像中的人脸。它首先加载一个级联分类器用于人脸检测,这个分类器是一个预先训练的模型,可以识别图像中的人脸。
然后它加载图像并使用 cv2.cvtColor()方法将其转换为灰度。然后将图像传递给分类器的 detectMultiScale()方法,该方法检测图像中的人脸。该方法返回检测到的人脸的坐标列表。
然后,该脚本循环遍历坐标列表,并使用 cv2.rectangle()方法在检测到的人脸周围绘制矩形。最后,使用 cv2.imshow()方法在屏幕上显示图像。
这只是OpenCV可以实现的目标的一个基本示例,还有更多可以自动化的功能,例如对象检测,图像处理和视频分析。OpenCV 是一个非常强大的库,可用于自动执行各种计算机视觉任务,例如面部识别、对象跟踪和图像稳定。
8、自动化数据加密:
自动化数据加密是指使用 Python 及其库自动加密和解密数据和文件。
Python 中最受欢迎的数据加密库之一是密码学。
“密码学”是一个提供加密配方和原语的库。它包括高级配方和常见加密算法(如对称密码、消息摘要和密钥派生函数)的低级接口。以下示例演示了如何使用加密库加密文件:
importos
fromcryptography.fernetimportFernet
fromcryptography.hazmat.backendsimportdefault_backend
fromcryptography.hazmat.primitivesimporthashes
fromcryptography.hazmat.primitives.kdf.pbkdf2importPBKDF2HMAC
password=b"super_secret_password"
salt=os.urandom(16)
kdf=PBKDF2HMAC(
algorithm=hashes.SHA256,
iterations=100000,
length=32,
salt=salt,
backend=default_backend()
)
key=base64.urlsafe_b64encode(kdf.derive(password))
cipher=Fernet(key)
#Encryptthefile
withopen("file.txt","rb")asf:
data=f.read()
cipher_text=cipher.encrypt(data)
withopen("file.txt","wb")asf:
f.write(cipher_text)
它首先使用 PBKDF2HMAC
密钥派生函数生成密钥,这是一个基于密码的密钥派生函数,使用安全哈希算法 SHA-256
和salt
值。
salt
值是使用os.urandom()函数生成的,该函数生成加密安全的随机字节。
然后,它创建一个 Fernet 对象,该对象是对称(也称为“密钥”)身份验证加密的实现。
然后,它读取明文文件,并使用 Fernet 对象的encrypt()方法对其进行加密。最后,它将加密数据写入文件。
请务必注意,用于加密文件的密钥必须保密并安全存储。如果密钥丢失或泄露,加密的数据将无法读取。
9、自动化测试和调试:
自动化测试和调试是指使用 Python 及其库自动运行测试和调试代码。在 Python 中,有几个流行的库用于自动化测试和调试,例如 unittest、pytest、nose 和 doctest。
下面是使用 unittest 库自动测试在给定字符串中查找最长回文子字符串的 Python 函数的示例:
deflongest_palindrome(s):
n=len(s)
ans=""
foriinrange(n):
forjinrange(i+1,n+1):
substring=s[i:j]
ifsubstring==substring[::-1]andlen(substring)>len(ans):
ans=substring
returnans
classTestLongestPalindrome(unittest.TestCase):
deftest_longest_palindrome(self):
self.assertEqual(longest_palindrome("babad"),"bab")
self.assertEqual(longest_palindrome("cbbd"),"bb")
self.assertEqual(longest_palindrome("a"),"a")
self.assertEqual(longest_palindrome(""),"")
if__name__=='__main__':
unittest.main()
此脚本使用 unittest 库自动测试在给定字符串中查找最长回文子字符串的 Python 函数。
‘longest_palindrome’ 函数将字符串作为输入,并通过遍历所有可能的子字符串并检查它是否是回文并且它的长度大于前一个来返回最长的回文子字符串。
该脚本还定义了一个从 unittest 继承的“TestLongestPalindrome”类。测试用例,并包含多种测试方法。
每个测试方法都使用 assertEqual()方法来检查 longest_palindrome() 函数的输出是否等于预期的输出。
当脚本运行时,将调用 unittest.main()
函数,该函数运行 TestLongestPalindrome
类中的所有测试方法。
如果任何测试失败,即longest_palindrome()
函数的输出不等于预期输出,则会打印一条错误消息,指示哪个测试失败以及预期和实际输出是什么。
此脚本是如何使用 unittest 库自动测试 Python 函数的示例。它允许您在将代码部署到生产环境之前轻松测试代码并捕获任何错误或错误。
10、自动化时间序列预测:
自动化时间序列预测是指使用 Python 及其库自动预测时间序列数据的未来值。在Python中,有几个流行的库可以自动化时间序列预测,例如statsmodels和prophet。
“prophet”是由Facebook开发的开源库,它提供了一种简单快捷的方式来执行时间序列预测。
它基于加法模型,其中非线性趋势与每年、每周和每天的季节性以及假日效应相吻合。它最适合具有强烈季节性影响的时间序列和多个季节的历史数据。
下面是使用 prophet 库对每日销售数据执行时间序列预测的示例:
importpandasaspd
fromfbprophetimportProphet
#Readindata
df=pd.read_csv("sales_data.csv")
#Createprophetmodel
model=Prophet()
#Fitmodeltodata
model.fit(df)
#Createfuturedataframe
future_data=model.make_future_dataframe(periods=365)
#Makepredictions
forecast=model.predict(future_data)
#Printforecastdataframe
print(forecast[['ds','yhat','yhat_lower','yhat_upper']])
正如Mr.X所说:一张图片胜过千言万语
还可以通过在上面添加以下代码行来包含预测销售额的视觉对象:
#Importvisualizationlibrary
importmatplotlib.pyplotasplt
#Plotpredictedvalues
model.plot(forecast)
plt.show()
#Plotpredictedvalueswithuncertaintyintervals
model.plot(forecast)
plt.fill_between(forecast['ds'],forecast['yhat_lower'],forecast['yhat_upper'],color='pink')
plt.show()
#Plotcomponentoftheforecast
model.plot_components(forecast)
plt.show()
第一个可视化效果
model.plot(forecast)
显示预测值和历史数据,它可以让您大致了解模型拟合数据的程度。
第二个可视化效果:
plt.fill_between(预测['ds'],预测['yhat_lower'],预测['yhat_upper'],color='pink')
显示具有不确定性区间的预测值,这使您可以查看预测中有多少不确定性。
第三个可视化效果
model.plot_components(forecast)
显示预测的组成部分,例如趋势、季节性和节假日。
结论
总之,Python的自动化能力超强并且不断发展,每天都在开发新的库和框架。
使用诸如pandas,opencv,cryptography,unittest,prophet等库,使得以高效和自动化的方式执行这些任务变得更加容易。
本文由 mdnice 多平台发布