BeautifulSoup
BeautifulSoup 是 Python 中一个强大的解析库,它可以用来解析 HTML,XML 等格式的文档。可以使用 Beautiful Soup 的
find_all()
方法来查找 HTML 中的
<script>
标签,进而获取其中的 JavaScript 代码。代码示例如下:
from bs4 import BeautifulSoup
html = """
<script>
console.log('Hello, World!')
</script>
</body>
</html>
soup = BeautifulSoup(html, 'html.parser')
scripts = soup.find_all('script')
for script in scripts:
print(script.string)
正则表达式
正则表达式也可以用来匹配 HTML 中的 <script>
标签。通过正则表达式匹配出 <script>
标签内的 JavaScript 代码,再通过 Python 的字符串处理函数来提取代码。代码示例如下:
import re
html = """
<script>
console.log('Hello, World!')
</script>
</body>
</html>
pattern = re.compile(r'<script>(.*?)</script>', re.DOTALL)
matches = re.findall(pattern, html)
for match in matches:
print(match.strip())
以上两种方法都可以用来解析 HTML 中的 JavaScript 脚本,根据实际情况选择即可。