新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 计算机科学论坛W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → 一段代码,有点问题,请大家帮忙 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 2538 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 一段代码,有点问题,请大家帮忙 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     widowss 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:0
      积分:54
      门派:XML.ORG.CN
      注册:2005/8/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给widowss发送一个短消息 把widowss加入好友 查看widowss的个人资料 搜索widowss在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看widowss的博客楼主
    发贴心情 一段代码,有点问题,请大家帮忙

    主要要解决的问题是我把一个html的网页转变为xml格式的,在下面这个问题中,如果网页格式正确,那么不会报错,否则会报错,有没有解决的办法
    import javax.swing.text.Element;
    import javax.xml.parsers.*;
    import javax.xml.parsers.DocumentBuilderFactory;
    import javax.xml.parsers.ParserConfigurationException;        

    DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
    DocumentBuilder bulider=factory.newDocumentBuilder();
    File xmlfile=new File(url);
    Document doc=bulider.parse(xmlfile);
    ~~~~~~~~~~~~~~~~~~~~~~~~~~~就在这个parse出错
    NodeList nodelist=doc.getElementsByTagName("bookAuthor");


    编译提示
    org.xml.sax.SAXParseException: 字符转换错误:“Unconvertible UTF-8 character beginning with 0xa3”(行号可能太小)。
     at org.apache.crimson.parser.InputEntity.fatal(Unknown Source)
     at org.apache.crimson.parser.InputEntity.fillbuf(Unknown Source)
     at org.apache.crimson.parser.InputEntity.isXmlDeclOrTextDeclPrefix(Unknown Source)
     at org.apache.crimson.parser.Parser2.maybeXmlDecl(Unknown Source)
     at org.apache.crimson.parser.Parser2.parseInternal(Unknown Source)
     at org.apache.crimson.parser.Parser2.parse(Unknown Source)
     at org.apache.crimson.parser.XMLReaderImpl.parse(Unknown Source)
     at org.apache.crimson.jaxp.DocumentBuilderImpl.parse(Unknown Source)
     at javax.xml.parsers.DocumentBuilder.parse(Unknown Source)
     at TestHTML2XML.get_all_para(TestHTML2XML.java:74)
     at TestHTML2XML.main(TestHTML2XML.java:97)
    Exception in thread "main"


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/15 21:41:00
     
     iamwym 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机硕士学位(版主)
      文章:2454
      积分:17456
      门派:XML.ORG.CN
      注册:2004/11/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给iamwym发送一个短消息 把iamwym加入好友 查看iamwym的个人资料 搜索iamwym在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问iamwym的主页 引用回复这个贴子 回复这个贴子 查看iamwym的博客2
    发贴心情 
    好像是文件编码有问题,你这个是什么api?
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/16 0:40:00
     
     yanxq 帅哥哟,离线,有人找我吗?
      
      
      威望:4
      等级:大四(GRE考了1400分!)(版主)
      文章:183
      积分:1309
      门派:XML.ORG.CN
      注册:2004/9/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给yanxq发送一个短消息 把yanxq加入好友 查看yanxq的个人资料 搜索yanxq在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看yanxq的博客3
    发贴心情 
    使用try catch来捕获并显示错误,就可以了
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/17 13:17:00
     
     yeanse 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:22
      积分:184
      门派:XML.ORG.CN
      注册:2004/12/8

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给yeanse发送一个短消息 把yeanse加入好友 查看yeanse的个人资料 搜索yeanse在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看yeanse的博客4
    发贴心情 
    你给出的源文件名称、路径有问题。。。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/19 11:03:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/21 9:43:28

    本主题贴数4,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    2,355.469ms