新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 搜索引擎, 信息分类与检索, 语义搜索, Lucene, Nutch, GRUB, Larbin, Weka
    [返回] 计算机科学论坛计算机技术与应用『 Web挖掘技术 』 → Weka如何连接数据库[原创] 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 16228 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: Weka如何连接数据库[原创] 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     DMman 帅哥哟,离线,有人找我吗?魔羯座1984-1-11
      
      
      威望:1
      头衔:数据挖掘青年
      等级:研二(Pi-Calculus看得一头雾水)(版主)
      文章:803
      积分:5806
      门派:W3CHINA.ORG
      注册:2007/4/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给DMman发送一个短消息 把DMman加入好友 查看DMman的个人资料 搜索DMman在『 Web挖掘技术 』 的所有贴子 点击这里发送电邮给DMman 访问DMman的主页 引用回复这个贴子 回复这个贴子 查看DMman的博客楼主
    发贴心情 Weka如何连接数据库[原创]

    以下介绍以SQL Server2000为例,其他的数据库操作方法一样,具体细节各异。

    1 安装驱动程序,SQL Server2000将三个.jar加到环境变量。
    2 修改 weka\experiment下的DatabaseUtils.props文件。
    我们可以看到有DatabaseUtils.props.odbc DatabaseUtils.props.oracle等
    我们先将DatabaseUtils.props随便改成一个其他的名字,然后将DatabaseUtils.props.mssqlserver改成DatabaseUtils.props,
    打开现在的DatabaseUtils.props可以看到以下部分:(#表示注释)

    2.1驱动加载
    # JDBC driver (comma-separated list)
    jdbcDriver=com.microsoft.jdbc.sqlserver.SQLServerDriver
    2.2数据库连接,如果在本机上可以将server_name改为127.0.0.1或者localhost
    # database URL
    jdbcURL=jdbc:sqlserver://127.0.0.1:1433
    2.3数据类型的转换。由于weka仅支持名词型(nominal)、数值型(numeric)、字符串、日期(date)。所以我们要将现在数据库中的数据类型对应到这四种类型上来。

    将以下数据类型对应的句子前面的注释符合去掉。由于SQL Server2000有其他的数据类型Weka尚不能识别,所以我们在下面再添加上
    smallint=3
    datetime=8等等

    string,getString()= 0;         -->nominal
    boolean,getBoolean() = 1;  -->nominal
    double,getDouble() = 2;    -->numeric
    byte,getByte() = 3;        -->numeric
    short,getByte()= 4;        -->numeric
    int,getInteger() = 5;            -->numeric
    long,getLong() = 6;                -->numeric
    gloat,getFloat() = 7;            -->numeric
    date,getDate() = 8;                -->date
    varchar=0
    float=2
    tinyint=3
    int=5
    3其他说明,我们暂时用不到,不用去管了
    # other options
    CREATE_DOUBLE=DOUBLE PRECISION
    CREATE_STRING=VARCHAR(8000)
    CREATE_INT=INT
    checkUpperCaseNames=false
    checkLowerCaseNames=false
    checkForTable=true

    4 OK,下面可以操作了!运行weka的Explore界面后,通过Open DB..打开SQL Viewer工作界面(3.5.5版本比3.4.10在这里精细了许多)。
    通过user我们设置好用户名和密码后即可connect;连接成功后,可以通过书写sql语句查询出想要的结果后,OK即可在Explore界面的
    preprocoss面板中看到了输入的数据。
    在连接读取数据库的数据时,SQL Viewer面板也提供了Info,相当与我们单纯用jdbc连接数据库时的调试信息。

    下面是我在网上下的一个工具(java源码,下载于souceforge网站),可以把数据库中的数据转换为Weka使用的.arff文件。当然,前提是安装了该数据库的驱程。有兴趣者可以一看。



    [此贴子已经被作者于2007-5-24 18:29:09编辑过]

       收藏   分享  
    顶(0)
      




    ----------------------------------------------
    数据挖掘青年 http://blogger.org.cn/blog/blog.asp?name=DMman
    纪录片之家 (很多纪录片下载)http://www.jlpzj.com/?fromuid=137653

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/5/24 17:24:00
     
     chenqian857 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:1
      积分:56
      门派:XML.ORG.CN
      注册:2008/5/26

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给chenqian857发送一个短消息 把chenqian857加入好友 查看chenqian857的个人资料 搜索chenqian857在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看chenqian857的博客2
    发贴心情 
    呵呵,还不错。斑竹对weka特别感兴趣
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/27 14:12:00
     
     susan81 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:1
      积分:61
      门派:XML.ORG.CN
      注册:2007/12/18

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给susan81发送一个短消息 把susan81加入好友 查看susan81的个人资料 搜索susan81在『 Web挖掘技术 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看susan81的博客3
    发贴心情 
    感谢!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/5/28 21:15:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Web挖掘技术 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/3 7:18:48

    本主题贴数3,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    62.500ms