with open('all_plugins_urls.txt','a') as out:
for a in soup.find_all('a', href=True):
out.write(baseurl+a['href'].replace('/','')+".json"+"\n")
综上所述,整个 Python 爬虫代码应该是这个样子的
import requests
from bs4 import BeautifulSoup
html=requests.get("http://plugins.svn.wordpress.org/").text
soup=BeautifulSoup(html,features="lxml")
lis=soup.find_all('li')
baseurl="https://api.wordpress.org/plugins/info/1.0/"
with open('all_plugins_urls.txt','a') as out:
for a in soup.find_all('a', href=True):
out.write(baseurl+a['href'].replace('/','')+".json"+"\n")
import turtle
turtle.pensize(5)
turtle.pencolor("yellow")
turtle.fillcolor("red")
turtle.begin_fill()
for i in range(5):
turtle.forward(200)
turtle.right(144)
turtle.end_fill()
continue 与 break 语句一样,都是用在 for 或者 while 的语句中。但是两者的含义不同:
break 会退出所有的循环;而 continue 只会退出目前所在的一个循环。
格式
continue
实例
#!/usr/bin/python3
# -*- coding: UTF-8 -*-
num = 6
while num > 0:
num = num -1
if num == 6:
continue
print ("剩余:", num)
print("\n\n程序结束")
运行
剩余: 5
剩余: 4
剩余: 3
剩余: 2
剩余: 1
剩余: 0
程序结束
pass 语句
pass 其实什么事情都不会做,只不过是用来做占位语句,保持程序的完整性。
格式
pass
实例
#!/usr/bin/python3
# -*- coding: UTF-8 -*-
num = 6
while num > 0:
num = num -1
if num == 2:
pass
print("Hey, I'm pass!")
print ("剩余:", num)
print("\n\n程序结束")