我在HTML格式相当大的文件,从Microsoft Word生成的。它是SOOOO凌乱和充分的臃肿的东西(如不明标签,不明等命名空间和其他东西臃肿)

有任何方法将其转换成普通的HTML语法时才?

有帮助吗?

解决方案

尝试 HTML整洁。我听到那很好由微软Word生成的HTML(肯定至少到Word 2000中,但可能在最近的版本太)。

其他提示

这是不是一个真正的编程问题,但(至少最近的版本),Word可以保存到“筛选过的网页”,这消除Office特定的标签和属性,只留下了该文件是必要的标签呈现在Web浏览器。所以,如果你有Word,你可以尝试用它来打开HTML文档并将其保存在该格式。

您可能正在寻找 HTML整洁,其中有适配器在相当太少了每一种语言。它有自己的选择,以清理Microsoft Word的HTML输出(和许多其他功能)。

尝试清理HTML 上行工具来清理字HTML

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top