我只是在寻找一种非常简单的方法来清理一些HTML(可能带有嵌入式JavaScript代码).我尝试了两个 不同的 HTML Tidy .NET端口,两者都抛出异常......
对不起,"干净"是指"缩进".HTML根本没有格式错误.这是严格的XHTML.
我终于得到了一些使用SGML的东西,但这是一个非常荒谬的代码块,可以缩进一些HTML.
private static string FormatHtml(string input)
{
var sgml = new SgmlReader {DocType = "HTML", InputStream = new StringReader(input)};
using (var sw = new StringWriter())
using (var xw = new XmlTextWriter(sw) { Indentation = 2, Formatting = Formatting.Indented })
{
sgml.Read();
while (!sgml.EOF)
xw.WriteNode(sgml, true);
}
return sw.ToString();
}
Run Code Online (Sandbox Code Playgroud) 我正在使用brew中的tidy-html5,我无法整理我的角度模板,因为它们使用自定义元素:
<due-diligence-point index="1" title="Lead Screening">
Run Code Online (Sandbox Code Playgroud)
这会在tidy-html5上抛出此错误:
line 26 column 9 - Error: <due-diligence-point> is not recognized!
Run Code Online (Sandbox Code Playgroud)
有一个选项我正在跳过,或者这只是不适合整洁?
我唯一的选择是手动填充"new-empty-tags"?
我有一个在Glassfish上运行的Java项目,它渲染了一些丑陋的HTML.它是使用各种内部和外部JSP库的副作用.我想设置一些后期渲染过滤器,它将通过HTMLTidy提供最终的HTML,以便源代码很好并且整洁有助于调试.这可能吗?
在服务器将JSP呈现为HTML之后,是否有内置机制来执行某些操作?该操作可以将生成的HTML作为字符串进行操作吗?是否有一些简单的内置选项可以在没有额外编码的情况下执行此操作
有没有一种简单的方法可以在Komodo Edit中重新格式化我的HTML,或者针对Tidy自动化这个过程?像Visual Studio中的Ctrl+ K,Ctrl+ 这样的东西D会很精彩.目前运行Ubuntu并安装了Tidy.
我使用php tidy来处理我的数据库中的html输入,
$fragment = tidy_repair_string($dom->saveHTML(), array('output-xhtml'=>1,'show-body-only'=>1));
Run Code Online (Sandbox Code Playgroud)
我在我的服务器上打开了这个php_tidy但我的实时服务器不支持整洁,
致命错误:在第587行的/customers/0/5/a/mysite.com/httpd.www/models/functions.php中调用未定义的函数tidy_repair_string()
我可以解决这个问题吗?
我有崇高的文本3,但在通过'Package Control:Install Package'安装sublimelinter-html-tidy后,没有任何改变.我还在我的Sublime 3上安装了Emmit,Bracket Highlighter,Side Bar和其他几个,他们都做了他们想要做的事情.他们工作.只有sublimelinter-html-tidy没有做任何事情,即使它在我的instaled包中.
任何帮助,或者如果有人能指出我正确的方向,都会很棒.
我已经使用了几天htmltidy,但使用它时总会发生"bug".这个bug会自动包装我的脚本标签!
我必须提到它们只是内联脚本,只链接到外部脚本.
在搜索高级整洁命令后,我仍然无法解决这个奇怪的问题.以前有没有人见过这种情况?
我的个人配置
indent: auto
indent-spaces: 4
wrap: 0
tidy-mark: no
char-encoding: utf8
doctype: auto
Run Code Online (Sandbox Code Playgroud)
我的未整理的test.html
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN">
<html>
<head>
<title></title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<link rel="stylesheet" href="css/generic.css" type="text/css">
<script src="js/jquery.min.js" type="text/javascript"></script>
</head>
<body>
</body>
</html>
Run Code Online (Sandbox Code Playgroud)
我整理的test.html
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN">
<html>
<head>
<title></title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<link rel="stylesheet" href="css/generic.css" type="text/css">
<script src="js/jquery.min.js" type="text/javascript">
</script>
</head>
<body>
</body>
</html>
Run Code Online (Sandbox Code Playgroud) 我正在尝试使用PHP(http://www.php.net/manual/en/book.tidy.php)的HTML Tidy实现来重新格式化大量的HTML.我有一个问题,其中Tidy将输出截断超过某一点(约8K).
当我创建一个大约10K长的字符串并将其传递给tidy_repair_string时,如下所示:
$output = tidy_repair_string($output, array(
'indent' => true, // enforce indentation
'hide-comments' => true, // Remove the comments
'wrap' => 100, // Break each line after 100 chars
'output-html' => true, // Output as HTML
'char-encoding' => $encoding // The input/output encoding
), $encoding);
Run Code Online (Sandbox Code Playgroud)
在8,070个字符之后我丢掉所有东西.如果我用10个字符填充字符串的开头,那么最后只剩下10个字符.
有没有办法改变tidy_repair_string的缓冲区大小,以便它更大?
看看http://www.php.net/manual/en/tidy.getconfig.php似乎没有配置选项,谷歌非常无益/我的Google-fu让我失望了,而且没有关于这个的大量文件.任何帮助将不胜感激!
编辑:我在Windows 7上使用xampp-portable-lite-win32-1.8.1-VC9.即使我改变php.ini使用memory_limit = 900M,问题仍然存在
我正在为修复html字符串编写一些代码.我读了一些很好的解决方案,它们与Tidy PHP类一起工作,但我遇到了一些麻烦.这篇文章写的是我想要的,但我需要安装/加载PHP Tidy类. 从截断的HTML字符串中关闭标记
我正在努力PHP 5.5.4
.我尝试按照一些教程安装整洁但没有任何附加内容.当我调用整洁的类时$tidi = new \tidy();
,NetBeans会向我推荐该类并单击它(Ctrl +单击)我看到它但刷新页面我得到了错误Class 'tidy' not found in ... /myfile.php line ...
我以相同的方式使用了类,$myVar = new \DomDocument();
但它完美地运行.
检查Tidy扩展是否像下面一样加载,我得到"NOT LOADED".
echo extension_loaded('tidy') ? "LOADED" : "NOT LOADED";
Run Code Online (Sandbox Code Playgroud)
请问有人可以解释一下Tidy的工作原理以及如何设置它?我的Ubuntu的版本是13.10.
我正面临HTML Tidy的严重问题(最新版本 - https://html-tidy.org).
简而言之:HTML整理转换这些HTML代码行
<div class="breadcrumbs" typeof="BreadcrumbList" vocab="http://schema.org/">
<div class="wrap">
<span property="itemListElement" typeof="ListItem">
<a property="item" typeof="WebPage" title="Codes Category" href="https://mysite.works/codes/" class="taxonomy category">
<span property="name">Codes</span>
</a>
<meta property="position" content="1">
</span>
</div>
Run Code Online (Sandbox Code Playgroud)
进入这些代码行 - 请仔细查看META TAGS的位置.
<div class="breadcrumbs" typeof="BreadcrumbList" vocab="http://schema.org/">
<div class="wrap">
<span property="itemListElement" typeof="ListItem">
<a property="item" typeof="WebPage" title="Codes Category" href="https://mysite.works/codes/" class="taxonomy category">
<span property="name">Codes</span>
</a>
</span>
<meta property="position" content="1">
</div>
Run Code Online (Sandbox Code Playgroud)
这导致了模式验证的一些严重问题.您可以在此处查看代码:https://search.google.com/structured-data/testing-tool/u/0/
由于此问题,客户端(URL:https://techswami.in)痕迹导航在搜索结果中不可见.
我在美化什么?
我的客户希望我让他/她的网站的源代码看起来"干净,可读和整洁".
所以我使用这些代码行来使它适合他/她.
注意:此代码100%完美地适用于以下WordPress设置.