很多站长朋友们都不太清楚html怎么转化为text,今天小编就来给大家整理html怎么转化为text,希望对各位有所帮助,具体内容如下:
本文目录一览: 1、 如何将现有的html文档转换为xhtml文档? 2、 怎样把HTML转换为TEXT文档? 3、 html如何转译为txt ,用java 4、 HTML输入框怎么输入后变成文本 5、 html 格式的 如何转换为 TXT 格式的 6、 已编译的HTML帮助文件 如何 制成text文件? 如何将现有的html文档转换为xhtml文档?一、html与xhtml的扩展名
html:(Hyper TextMark-uoLanguage)或(hyperText Markup Language)中文为超文本标记语言或超文本链接标示语言。
xhtml:(Extensible HyperText Markup Language)扩展超文本标记语言。下一代html.xhtml是以xml应用的方式定义的html.
二、如何从html转到xhtml?
1.向每张页面的第一行添加xhtml<!DOCTYPE>
2.向每个页面的html元素添加xmlns属性。
3.把所有元素名改为小写。
4.把所有的属性名改为小写。
5.关闭所有的空元素。
6.为所有的属性值加引号。
例:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"">
<html xmlns="">
<head>
<title>Title of document</title>
</head>
<body>
......
</body>
</html>
7.
用 W3C 验证器检验 XHTML
在下面的文本框中输入您的网址:
8.XHTML 元素 - 语法规则:
XHTML 元素必须正确嵌套
XHTML 元素必须始终关闭
XHTML 元素必须小写
XHTML 文档必须有一个根元素
9.XHTML 属性 - 语法规则
XHTML 属性必须使用小写
XHTML 属性值必须用引号包围
XHTML 属性最小化也是禁止的
————————————————
版权声明:本文为CSDN博主「tanlina_97」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:
怎样把HTML转换为TEXT文档?直接重命名把html改为text不过你看不到文件名的后缀那你就的去设置一下,这样就能看到了`````
选择菜单的“工具”→“文件夹选项…”在弹出的对话框中选择“查看”选项卡然后→去掉“隐藏已知文件类型的扩展名”
这样你就能看到所有隐藏的扩展名了。。。
html如何转译为txt ,用javapackage com;
/*
* File: WebFormatter.java
* Created on 2005-6-24
* Author: Liao Xuefeng, asklxf@163.com
* Copyright (C) 2005, Liao Xuefeng.
*/
import java.util.*;
import java.text.SimpleDateFormat;
/**
* Do some format on web display.
*
* @author Xuefeng
*/
public class WebFormatter {
public static String html2text(String html) {
StringBuffer sb = new StringBuffer(html.length());
char[] data = html.toCharArray();
int start = 0;
boolean previousIsPre = false;
Token token = null;
for(;;) {
token = parse(data, start, previousIsPre);
if(token==null)
break;
previousIsPre = token.isPreTag();
sb = sb.append(token.getText());
start += token.getLength();
}
return sb.toString();
}
private static Token parse(char[] data, int start, boolean previousIsPre) {
if(start>=data.length)
return null;
// try to read next char:
char c = data
很多站长朋友们都不太清楚html怎么转化为text,今天小编就来给大家整理html怎么转化为text,希望对各位有所帮助,具体内容如下:
;if(c=='<') {
// this is a tag or comment or script:
int end_index = indexOf(data, start+1, '>');
if(end_index==(-1)) {
// the left is all text!
return new Token(Token.TOKEN_TEXT, data, start, data.length, previousIsPre);
}
String s = new String(data, start, end_index-start+1);
// now we got s="<...>":
if(s.startsWith("<!--")) { // this is a comment!
int end_comment_index = indexOf(data, start+1, "-->");
if(end_comment_index==(-1)) {
// illegal end, but treat as comment:
return new Token(Token.TOKEN_COMMENT, data, start, data.length, previousIsPre);
}
else
return new Token(Token.TOKEN_COMMENT, data, start, end_comment_index+3, previousIsPre);
}
String s_lowerCase = s.toLowerCase();
if(s_lowerCase.startsWith("<script")) { // this is a script:
int end_script_index = indexOf(data, start+1, "</script>");
if(end_script_index==(-1))
// illegal end, but treat as script:
return new Token(Token.TOKEN_SCRIPT, data, start, data.length, previousIsPre);
else
return new Token(Token.TOKEN_SCRIPT, data, start, end_script_index+9, previousIsPre);
}
else { // this is a tag:
return new Token(Token.TOKEN_TAG, data, start, start+s.length(), previousIsPre);
}
}
// this is a text:
int next_tag_index = indexOf(data, start+1, '<');
if(next_tag_index==(-1))
return new Token(Token.TOKEN_TEXT, data, start, data.length, previousIsPre);
return new Token(Token.TOKEN_TEXT, data, start, next_tag_index, previousIsPre);
}
private static int indexOf(char[] data, int start, String s) {
char[] ss = s.toCharArray();
// TODO: performance can improve!
for(int i=start; i<(data.length-ss.length); i++) {
// compare from data[i] with ss[0]:
boolean match = true;
for(int j=0; j<ss.length; j++) {
if(data[i+j]!=ss[j]) {
match = false;
break;
}
}
if(match)
return i;
}
return (-1);
}
private static int indexOf(char[] data, int start, char c) {
for(int i=start; i<data.length; i++) {
if(data[i]==c)
return i;
}
return (-1);
}
public static void main(String[] args) {
String a = "<div>hahah</div>" +
"<h1><a><img src='/data/upload/help/202211/19/cd1942225e37166177c9046a7fab1458.gif'/></a>举报</h1>";
WebFormatter web = new WebFormatter();
String ax = WebFormatter.html2text(a);
System.out.println(ax);
}
}
class Token {
public static final int TOKEN_TEXT = 0; // html text.
public static final int TOKEN_COMMENT = 1; // comment like <!-- comments... -->
public static final int TOKEN_TAG = 2; // tag like <pre>, <font>, etc.
public static final int TOKEN_SCRIPT = 3;
private static final char[] TAG_BR = "<br".toCharArray();
private static final char[] TAG_P = "<p".toCharArray();
private static final char[] TAG_LI = "<li".toCharArray();
private static final char[] TAG_PRE = "<pre".toCharArray();
private static final char[] TAG_HR = "<hr".toCharArray();
private static final char[] END_TAG_TD = "</td>".toCharArray();
private static final char[] END_TAG_TR = "</tr>".toCharArray();
private static final char[] END_TAG_LI = "</li>".toCharArray();
private static final Map SPECIAL_CHARS = new HashMap();
private int type;
private String html; // original html
private String text = null; // text!
private int length = 0; // html length
private boolean isPre = false; // isPre tag?
static {
SPECIAL_CHARS.put(""", "\"");
SPECIAL_CHARS.put("<", "<");
SPECIAL_CHARS.put(">", ">");
SPECIAL_CHARS.put("", "");
SPECIAL_CHARS.put("®", "(r)");
SPECIAL_CHARS.put("©", "(c)");
SPECIAL_CHARS.put(" ", " ");
SPECIAL_CHARS.put("£", "?");
}
public Token(int type, char[] data, int start, int end, boolean previousIsPre) {
this.type = type;
this.length = end - start;
this.html = new String(data, start, length);
//TODO 打印html text
// System.out.println("[Token] html=" + html + ".");
parseText(previousIsPre);
// System.out.println("[Token] text=" + text + ".");
}
public int getLength() {
return length;
}
public boolean isPreTag() {
return isPre;
}
private void parseText(boolean previousIsPre) {
if(type==TOKEN_TAG) {
char[] cs = html.toCharArray();
if(compareTag(TAG_BR, cs) || compareTag(TAG_P, cs))
text = "\n";
else if(compareTag(TAG_LI, cs))
text = "\n* ";
else if(compareTag(TAG_PRE, cs))
isPre = true;
else if(compareTag(TAG_HR, cs))
text = "\n--------\n";
else if(compareString(END_TAG_TD, cs))
text = "\t";
else if(compareString(END_TAG_TR, cs) || compareString(END_TAG_LI, cs))
text = "\n";
}
// text token:
else if(type==TOKEN_TEXT) {
text = toText(html, previousIsPre);
}
}
public String getText() {
return text==null ? "" : text;
}
private String toText(String html, final boolean isPre) {
char[] cs = html.toCharArray();
StringBuffer buffer = new StringBuffer(cs.length);
int start = 0;
boolean continueSpace = false;
char current, next;
for(;;) {
if(start>=cs.length)
break;
current = cs
很多站长朋友们都不太清楚html怎么转化为text,今天小编就来给大家整理html怎么转化为text,希望对各位有所帮助,具体内容如下:
; // read current charif(start+1<cs.length) // and next char
next = cs[start+1];
else
next = '\0';
if(current==' ') {
if(isPre || !continueSpace)
buffer = buffer.append(' ');
continueSpace = true;
// continue loop:
start++;
continue;
}
// not ' ', so:
if(current=='\r' next=='\n') {
if(isPre)
buffer = buffer.append('\n');
// continue loop:
start+=2;
continue;
}
if(current=='\n' || current=='\r') {
if(isPre)
buffer = buffer.append('\n');
// continue loop:
start++;
continue;
}
// cannot continue space:
continueSpace = false;
if(current=='') {
// maybe special char:
int length = readUtil(cs, start, ';', 10);
if(length==(-1)) { // just '':
buffer = buffer.append('');
// continue loop:
start++;
continue;
}
else { // check if special character:
String spec = new String(cs, start, length);
String specChar = (String)SPECIAL_CHARS.get(spec);
if(specChar!=null) { // special chars!
buffer = buffer.append(specChar);
// continue loop:
start+=length;
continue;
}
else { // check if like 'Ӓ':
if(next=='#') { // maybe a char
String num = new String(cs, start+2, length-3);
try {
int code = Integer.parseInt(num);
if(code>0 code<65536) { // this is a special char:
buffer = buffer.append((char)code);
// continue loop:
start++;
continue;
}
}
catch(Exception e) {}
// just normal char:
buffer = buffer.append("");
// continue loop:
start+=2;
continue;
}
else { // just '':
buffer = buffer.append('');
// continue loop:
start++;
continue;
}
}
}
}
else { // just a normal char!
buffer = buffer.append(current);
// continue loop:
start++;
continue;
}
}
return buffer.toString();
}
// read from cs
很多站长朋友们都不太清楚html怎么转化为text,今天小编就来给大家整理html怎么转化为text,希望对各位有所帮助,具体内容如下:
util meet the specified char 'util',// or null if not found:
private int readUtil(final char[] cs, final int start, final char util, final int maxLength) {
int end = start+maxLength;
if(end>cs.length)
end = cs.length;
for(int i=start; i<start+maxLength; i++) {
if(cs[i]==util) {
return i-start+1;
}
}
return (-1);
}
// compare standard tag "<input" with tag "<INPUT value=aa>"
private boolean compareTag(final char[] ori_tag, char[] tag) {
if(ori_tag.length>=tag.length)
return false;
for(int i=0; i<ori_tag.length; i++) {
if(Character.toLowerCase(tag[i])!=ori_tag[i])
return false;
}
// the following char should not be a-z:
if(tag.length>ori_tag.length) {
char c = Character.toLowerCase(tag[ori_tag.length]);
if(c<'a' || c>'z')
return true;
return false;
}
return true;
}
private boolean compareString(final char[] ori, char[] comp) {
if(ori.length>comp.length)
return false;
for(int i=0; i<ori.length; i++) {
if(Character.toLowerCase(comp[i])!=ori[i])
return false;
}
return true;
}
public String toString() {
return html;
}
}
HTML输入框怎么输入后变成文本HTML输入框输入后变成文本是通过输入后失去焦点,更改为label嵌套input来实现的。
实现思路:当输入文本后,隐藏input对象,然后把文本内容追加到label标签内。
实现代码:
1、html代码:
<!DOCTYPE html>
<html>
<head>
<script src="jquery-1.8.3.min.js"/>
</head>
<body>
<label>
<input type="text" name="输入后消失" id="input1"/>
</label>
</body>
</html>
2、js代码:
$(document).ready(function(){
$("#input1").blur(function(){
$(this).hide();
$(this).parent().html($(this).val());
});
});
3、显示效果如下:
输入文字:
显示结果:
html 格式的 如何转换为 TXT 格式的可以试试使用e书部落电子书制作器,把html文件拖动到ebookpk中,然后选择制作"txt电子书"即可
e书部落电子书制作器(ebookpk)可以把jar,word,txt,pdf,umd,chm等文档进行互转,功能十分强大。
e书部落(ebookPK)是一款集内容采集,制作,分享于一体的多功能制作器。目前能导入和制作txt,jar,umd,chm,pdf,doc,html七种电子书。利用本地导入功能,可合并各类文件,是标准的jar,umd,chm,word“反编译器”和“txt电子书合并器”;利用网络导入功能,可自动爬行并抓取各类网页文字,成名副其实的“网络印刷机”。
下载地址:
视频教程:
已编译的HTML帮助文件 如何 制成text文件?TxtEasy将html文件转换成txt文档的软件
Html转换大师可以进行纯文本文件(.txt)与HTML文件之间相互转换,支持批量转换、GB<->Big5、过滤,可以定制自己的模板使转换更加灵活、方便、个性化。
关于html怎么转化为text的介绍到此就结束了,不知道本篇文章是否对您有帮助呢?如果你还想了解更多此类信息,记得收藏关注本站,我们会不定期更新哦。
查看更多关于html怎么转化为text的简单介绍的详细内容...