存档在 ‘【软件】’ 分类

【软件】AntConc 词频统计分析软件

2017年5月4日

【介绍】

AntConc: A freeware corpus analysis toolkit for concordancing and text analysis.

最新版本:Windows (3.4.4)

官网:http://www.laurenceanthony.net/software/antconc/
讨论:https://www.zhihu.com/question/31320540

中文手册:http://www.laurenceanthony.net/software/antconc/resources/help_AntConc321_chinese.pdf

下载:https://pan.baidu.com/s/1qYpj5Xq 密码: 66b4

链接里有软件本体和单词原型表;每次用的时候都要重新加载原型表。

软件包含7个工具(tool):

  1. Concordance Tool(索引工具):用于查找某个关键词出现时的具体文本。内容显示在KWIC中,代表KeyWord In Context。表示这个关键词在文本中是如何被使用的。
  2. Concordance Plot Tool(索引节点工具):关键词在全部文本中的出现的分布图。
  3. File View Tool(文件浏览工具):在整个文本中显示关键词。你可以从整个文本的角度,更加全面的了解某词的使用情况。
  4. Clusters/N-Grams(簇):了解关键词其后词的搭配情况。Collocates(搭配):跟clusters是配合用的。它统计了这个词有多少次是跟哪个单词搭配的。
  5. Word List(语汇列表):统计整个文本有多少字数,使用了多少词汇,依照出现次数排序。这样,你就可以知道哪些是高频词。
  6. Keyword List(关键词列表):

【实例】

北极狐<曾经用AntConc统计了《哈利波特》七部的词汇情况。

《哈利波特》一共7部,总字数是112万多。使用单词词汇量是15500左右。
频率最高的前100个词汇,就占字63万。(在这100个词里,除了6个人名:哈利,罗恩,赫敏,邓布利多,海格,斯内普,每个咱们初中都学过。)
频率最高的前1000个词汇,占字96万。
频率最高的前3000个词汇,占字106万。
也就是说,3000个单词,就占全书的94.6%。
在这一共15500左右的词汇中,其中4841个词汇在这7部书里只出现过一次。

怎么样提取《哈利波特》七部的生词呢?

  1. 准备有一份非生词的词汇表
  2. 将《哈利波特》七部的15500左右单词用AntConc导出。
  3. 将两个词汇表放入 Excel。用 vlookup 函数就可以统计出来:=VLOOKUP(E1,A:B,2,FALSE) 。A 列放过已知词汇表;B 列加个标注。E 列放入需要统计的词汇表。F 列输入公式,双击单元格,公式自动下拉。然后,你就看到结果了。E列中凡是你认识的单词,在F列都会出现对应的“我知”标注。#N/A 就是你的生词。

【同类工具】

爱英阅(iYingYue)

官网:http://www.sixue.info/iyingyue/

VocabularyAnalyzer

官网:http://tools.eflclub.me/VocabularyAnalyzer

TreeTagger

官网:http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/
介绍:http://www.cnblogs.com/kaituorensheng/p/3437807.html

怎样通过火车头向Destoon发布数据

2017年3月21日

【发布接口:Destoon5.0】

下载:http://bbs.destoon.com/forum.php?mod=attachment&aid=MTk1NzJ8MTJjMTMxOTV8MTQ5MDE2NDg4N3w2NjMyfDcxMzk1
参考:http://www.destoon.com/doc/skill/54.html

【采集器:Locoy Spider】

下载:http://www.locoy.com/download

【发布模块:Destoon for Locoy Spider】

http://bbs.locoy.com/forum.php?mod=viewthread&tid=150593&extra=&highlight=destoon&page=1

UTF8:http://pan.baidu.com/s/1c1YFbUw
GBK:http://pan.baidu.com/s/1kVrxFDX

destoon采集专家简介:
1:destoon采集接口说简单点就是一个网站内容入库接口,传统获取数据方式是需要通过人工复制粘贴到我们自己的网站,用时较长较慢。而destoon采集接口就是代替人工复制粘贴,速度及效率是人工的千百倍以上。
2:destoon采集接口是依靠火车头采集器完成采集任务,程序自带火车头8.0及模块规则,用户下载即可使用,无需再单独安装火车头。
3:接口完全免费没有任何域名限制及后门,用户只要会写规则就可以完全免费采集任何网站。
4:接口完全是用的destoon官方程序预留的api接口2次开发,毋须更改任何系统文件,绿色环保!
5:只要掌握好采集速度可以实现完全模拟人工发布,百度蜘蛛是看不出来采集的。
6:接口可以支持destoon官方程序4.0-7.0程序使用,(做过2次开发的请自测)。
7:我们的接口及规则完全永久免费在http://bbs.destoon.cc/我们的官方论坛提供更新及技术支持,并且不定期的分享免费规则。
8:程序自带24个全行业通用参考规则给大家使用,会写规则的可以参考默认规则标签格式来自己制作规则。

一、SEO
(1)、destoon7.采集器采用火车头V8版 经过采集优化后能让搜索引擎收录更多,哪怕是您一个外链都没有发布,您一点SEO都不懂,只要在购买我们采集软件前你的网站没有被搜索引擎K、网站本身正常,都能有不错的收录,收录详情请看演示
(2)、支持自动分类会员组,如果目标站是企业会员就入库到企业会员组,如果是个人就入库到个人会员组(需要通过代码自行判断用户组)
(3)、会员名、公司名、内容信息,前后都支持添加自定义文字内容,方便辨认采集内容及SEO。
(4)、以采集到的公司名的拼音作为会员帐号,对SEO更有利。

二、模拟人工智能化处理数据
接口与传统的API接口不同,常用API接口是直接插入数据到数据库不利于SEO。
收费版接口能模拟人工发布内容,比如:自动下载图片、自动水印、自动生成静态页。
详情如下:
(1)、支持采集内容后自动生成静态页面(动态或伪静态下需要这个功能)。
(2)、所有模块分类都支持自动下载标题图片、内容图片,并且自动加水印然后全自动下载上传图片到服务器。(需要在后台每个对应模块的模块设置里开启“下载内容远程图片”功能)。
(3)、检测到模块内容有图片的采集内容,并且自动设置第一张为标题图片。
(4)、因网络或者其他原因未正常生成成功的图片,自动记录下来,支持一键重下载这些没下载成功的图片。
(5)、自由设置每个频道的图片是否下载、下载目录、盗链、水印模式等。
(6)、自由设置供应、求购、招商等这类频道,是否启用三张标题图的功能(无需要再在规则里设置,全由接口控制)。
(7)、采集内容可以自由设置采集目标站上的时间,还是用当前时间。

20161215更新
1:开放所有模块,可以自动关联会员。
2:所有destoon模块都可以采集,开放API接口所有权限,不在做任何限制。
3:规则标签去除上一个版本中带的a和b标签,所有标签名是参考同步dt系统后台标签名,防止大家写规则出错。
4:公布所有模块标签名,方便会写规则的用户自己写规则,达到完全免费的目的。
5:修复资讯自动获取简介问题。
6:修复上一个版本中存在的来源,来源链接,作者等标签无效问题。
7:新增destoon规则自动设置推荐级别。
8:新增destoon城市分站采集支持及修复上个版本中地区标签无效问题。
9:修复文章无法自动从内容中获取第一张内容图片为标题图片。
10:新增供求等模块3张标题图片支持。
11:新增采集问题自动排查功能。
12:规则模块全部从写,免费版规则可以和商务版、商务高级版规则通用。
13:接口支持destoon4.0-7.0原装系统采集。
14:新增了商城发布功能,适合阶梯价格。
15:新增团购、商圈、商城等模块的采集支持。

版权归作者所有,任何形式转载请联系作者。
作者:微信文章采集器(来自豆瓣)
来源:https://www.douban.com/note/578331008/

DESTOON® B2B网站管理系统是一套基于PHP+MySQL的开源B2B电子商务行业门户网站解决方案,当前已发布会员、分站、商城、供应、求购、行情、公司、展会、文章、信息、品牌、团购、图库、专题、视频、下载、人才、知道等模型

下面教大家如何用孤狼公众号助手发布文章

1.下载接口文件,下载地址:https://pan.baidu.com/s/1slf1LY9 进去文件夹,找到jiekouwenj然后解压出来看到三个文件,把三个文件复制到网站目录下api目录里:utf-8function.php、gbkfunction.php、destoon.cc.php

2.孤狼微信采集器上,设置选项,选择自定义网站类型,

提交地址:http://网址/api/destoon.cc.php?moduleid=21(21代表资讯栏目,无需修改)
提交方式:POST 网站编码 UTF-8
提交数据:catid={id}&title={title}&status=3&level=0&introduce=&hits={read}&auth=123456&content={content}&fromurl=&addtime=2016-8-26&author=&tag=&save_remotepic=&thumb_no=&username=admin&copyfrom=&clear_link=1
成功标识:发布成功

https://pan.baidu.com/share/link?uk=1545346389&shareid=1438955339

【官网】

http://bbs.destoon.cc/forum-37-1.html

【WPM破解】

https://shenxiaorj.taobao.com/

Google翻译者辅助工具

2017年3月14日

官网:https://translate.google.com/toolkit/list#translations/active
介绍:http://myfairland.net/google-translator-toolkit-is-good/

插件:https://code.google.com/archive/p/mason-script-for-google-translator-toolkit/

刚才在寻找一个在线工具或者一套代码实现中英文对照翻译,Google翻译者工具是最满意的。

参考:https://github.com/FokkeZB/translator

怎样下载GitHub离线安装包

2017年2月21日

安装器:https://desktop.github.com/

但启动后,等待是无穷无尽的。

GitHub 3.3.4.0 离线安装包

2017年1月31日最新版的Github for Windows离线安装包。

参考:http://download.csdn.net/user/devsplash
下载:

github离线版_3_0_5_2

参考:https://www.zhihu.com/question/23110947
参考:https://github.com/nimojs/learn-js/issues/2
下载:https://pan.baidu.com/s/1mhVe9xY 密码: xxy9

github离线版_Git-1.9.2-preview20140411

下载:http://www.cr173.com/soft/82437.html

制作方法

参考:http://coderafi.github.io/2015/07/08/github-windows-offline/
下载:https://github.com/CoderAFI/ClickOnceCombiner

参考:http://www.tuicool.com/articles/rmYZFr

电子书

下载:http://www.itshuji.com/keil/3329.html

软件:用友T3财务管理

2016年8月2日

安装用友财务软件之前一下要先安装数据库。

MSSQL2005数据库:

教程:http://www.ufidawhy.com/shujuku/MSSQL2005AZ

下载:http://pan.baidu.com/s/1wevlc

下载:一键安装 http://pan.baidu.com/s/1dD3zAZf
密码:http://www.ufidawhy.com/shujuku/870
其他:SA密码 123456
补丁:http://www.jb51.net/softs/36936
补丁:https://www.microsoft.com/zh-cn/download/details.aspx?id=34846

MSDE2000数据库:

教程:http://www.ufidawhy.com/jcufida/msde2000AZ
注意:分windows xp和windows 7操作系统两种安装方法

下载:http://pan.baidu.com/s/1c031LZU

用友T3:

教程:http://www.ufidawhy.com/T3/yyT3az
教程:WIN7 http://www.ufidawhy.com/jc/view/index15
教程:WIn7的UAC控制关闭:http://www.ufidawhy.com/jcufida/win7uac
教程;修改计算机名:http://www.ufidawhy.com/jcufida/jisuanjiming

下载:http://pan.baidu.com/s/1OhMZc
密码:http://edu.ufidawhy.com/thread-417-1-1