添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

今天在.Net Core中对外网新闻进行爬虫抓取,最初抓取到的新闻中出现了乱码,后来通过GB2312进行了编码,结果报错“ Unhandled Exception: System.ArgumentException: 'GB2312' is not a supported encoding name. For information on defining a custom encoding, see the documentation for the Encoding.RegisterProvider method.”,解决方法如下

为了解决中文乱码问题,使用了如下代码

byte[] response1 = await client.GetByteArrayAsync(url1);
string temp = Encoding.GetEncoding("GB2312").GetString(response1);

Unhandled Exception: System.ArgumentException: 'GB2312' is not a supported encoding name. For information on defining a custom encoding, see the documentation for the Encoding.RegisterProvider method.

1、在NuGet包中安装包System.Text.Encoding.CodePages

2、在使用编码方法(Encoding.GetEncoding("GB2312"))之前,对编码进行注册( Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);),代码如下

var url1 = "需要抓取新闻列表的url";
//以byte[]获取html
byte[] response1 = await client.GetByteArrayAsync(url1);
//将byte[]重新编码成GB2312;
Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);
string temp = Encoding.GetEncoding("GB2312").GetString(response1);

修改完成后重新编译成功

前言今天在.Net Core中对外网新闻进行爬虫抓取,最初抓取到的新闻中出现了乱码,后来通过GB2312进行了编码,结果报错“Unhandled Exception: System.ArgumentException: 'GB2312' is not a supported encoding name. For information on defining a custom encoding, see the documentation for the Encoding.RegisterProvi. 在 .Net Core 使用 XElement解析 GB2312 编码 的xml文件, 代码如下: stri ng xmlp = "G:\\test\\content.xml"; XElement xe = XElement.Load(xmlp); var tittle = xe.Element("TITLE").Value.Trim(); var author = xe.Element("AUTHOR").Value.Trim(); 报错 如下: ‘ GB2312 ’ is not a supported . System.Text. Encoding .Get Encoding (" GB2312 ") System.Text. Encoding .Get Encoding ("GBK") 会抛出异常: Unhandled Exception: System.ArgumentException: ' GB2312 ' is not a su... Unhandled Exception: System.ArgumentException: ' GB2312 ' is not a supported encoding name. For information on def ini ng a cus tom encoding , see the documentation for the Encoding .RegisterProvider method.
dotnet add package System.Text. Encoding .CodePages --version 4.4.0 System.Text. Encoding .RegisterProvider (System.Text.CodePages Encoding Provider.Instance); System.Text. Encoding .Get Encoding (" GB2312 ") 【SharePoint】通过spfx与react开发扩展部件时候,在gulp serve时候,报错index.d.ts(30,13): error TS1005: ‘;‘ expected解决方案 压力也没那么大: 有用,谢谢 【clickhouse】在CentOS中离线安装clickhouse 去tm的老汤姆: 非常详细,赞 表情包 【clickhouse】在CentOS中离线安装clickhouse weixin_39103106: 换存储路径需要修改 文件夹的权限 chown -R clichouse:clickhouse /disk/data/ 【.net core】.Net Core项目发布到IIS后访问出现404错误解决方案 余音Yoin: 请问我按照您的方法部署到IIS成功之后,我在本地跑一下项目这个Web.Config又会改回原来的样子,请问有什么方法让它不会改 【vue】创建第一个vue+element ui项目(全网最详细) 地球不爆炸: 真的是泰酷辣!!! 【JAVA】若依(ruoyi)框架配置多数据源后,报错 execute error. SELECT 1 FROM DUAL,DUAL doesn‘t exist. (UNKNOWN_TABLE) 【Linux服务器Java环境搭建】09 在CentOS系统中安装和配置clickhouse数据库