cheerio.html()抓取的HTML内容乱码问题

2019-08-22564次阅读javascript

其实不是乱码,是HTML实体编码即字符实体(character entities)。cheerio中的.html()方法默认开启转换实体编码的功能,你可以选择关闭它:

const $ = cheerio.load(body,{decodeEntities:false}); 

 

上一篇: js中html实体字符转义和反转义  下一篇: request、request-promise、cheerio抓取网页内容  

cheerio.html()抓取的HTML内容乱码问题相关文章