添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
  • BeautifulSoup
  • BeautifulSoup 是 Python 中一个强大的解析库,它可以用来解析 HTML,XML 等格式的文档。可以使用 Beautiful Soup 的 find_all() 方法来查找 HTML 中的 <script> 标签,进而获取其中的 JavaScript 代码。代码示例如下:

    from bs4 import BeautifulSoup
    html = """
        <script>
          console.log('Hello, World!')
        </script>
      </body>
    </html>
    soup = BeautifulSoup(html, 'html.parser')
    scripts = soup.find_all('script')
    for script in scripts:
        print(script.string)
    
  • 正则表达式
  • 正则表达式也可以用来匹配 HTML 中的 <script> 标签。通过正则表达式匹配出 <script> 标签内的 JavaScript 代码,再通过 Python 的字符串处理函数来提取代码。代码示例如下:

    import re
    html = """
        <script>
          console.log('Hello, World!')
        </script>
      </body>
    </html>
    pattern = re.compile(r'<script>(.*?)</script>', re.DOTALL)
    matches = re.findall(pattern, html)
    for match in matches:
        print(match.strip())
    

    以上两种方法都可以用来解析 HTML 中的 JavaScript 脚本,根据实际情况选择即可。

  •