搜狗丽的黑核实验室室有核领域相关的文本吗

PPV课数据科学社区(ppvke123)原文发表时间:本文参与,欢迎正在阅读的你也加入,一起分享。分享分享文章到朋友圈分享文章到 QQ分享文章到 QQ 空间分享文章到微博复制文章链接到剪贴板扫描二维码扫描关注云+社区2123 篇文章53 人订阅相关文章来自专栏348来自专栏273来自专栏327来自专栏322来自专栏340来自专栏361扫描二维码扫描关注云+社区搜狗实验室_百度百科
清除历史记录关闭
声明:百科词条人人可编辑,词条创建和修改均免费,绝不存在官方及代理商付费代编,请勿上当受骗。
搜狗实验室
搜狗实验室(Sogou Labs)是搜狗搜索核心研发团队对外交流的窗口,包含数据资源、研究合作等几个栏目。我们期望通过这个,展现搜狗研发团队强大的研发、创新能力;推动学术界和产业界的交互;了解用户对新产品的需求。
搜狗实验室概述
我们的目标:为中文网民的互联网生活提供更加全面、更加优质的服务。
我们会在“官方博客”和“搜狗实验室吧”与搜索引擎爱好者和广大研究人员展开交流。
搜狗实验室评测集合
搜索结果评价 版本:2008 发布时间:
判断搜索结果与查询的相关性,是否符合搜索意图。
话题跟踪及检测评价 版本:2008 发布时间:
评测新闻话题跟踪及检测效果。
文本分类评价 版本:2008 发布时间:
评估文本分类结果的正确性。
搜狗实验室语料数据
互联网语料库 版本:2008 发布时间:
TB规模的独家资料,给您一个真实全面的互联网。
链接关系库 版本:2008 发布时间:
包括对应互联网语料库内文档的链接关系列表。
SogouRank库 版本:2008 发布时间:
互联网语料库中各页面的重要程度评级
用户查询日志 版本:2008 发布时间:
网页搜索用户查询及点击记录
搜狗实验室新闻数据
全网数据 版本:2008 发布时间:
来自多家新闻站点近20个栏目的分类新闻数据
搜狐新闻数据 版本:2008 发布时间:
来自近20个栏目的分类新闻数据
搜狗实验室图片数据
互联网图片库版本:2006 发布时间:
16万张抓取图片及标注数据集合
互联网词库版本:2006 发布时间:
基于互联网语料环境的高频词对应的词频、词性信息
中文词语搭配库版本:2006 发布时间:
基于互联网语料的字词搭配关系统计
清除历史记录关闭你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
每太看明白你的意思,不过还是给出使用正则表达式的例子吧,如下:
val keyRegex = &&&\[[^\]]+]&&&
val keyWords = lines.map(line=&keyRegex.r.findAllIn(line).mkString).filter(_!=&&)
其他你要统计不同时间段的, 可以在此基础上加上你的具体业务逻辑就好了,这点本身和正则表达式关系不大。
非maven项目直接将spark jar包下载下来,如果是eclipse环境,直接add external jar指定一下包的位置就可以。
如果是IDEA,File-&Project Structure-&Modules-&Dependencies,然后点右侧加号,选JARs or Directories。
要回复问题请先或
人生不止眼前的苟且,还有诗和远方的田野!^.^
浏览: 1052
关注: 3 人&>&搜狗实验室文本分类语料
搜狗实验室文本分类语料
上传大小:29.17MB
搜狗实验室用于文本分类的语料库,包含财经、互联网、健康、教育、军事、旅游、体育、文化、招聘9个类别文本数据,每个类别包含1990篇文本。
综合评分:0
{%username%}回复{%com_username%}{%time%}\
/*点击出现回复框*/
$(".respond_btn").on("click", function (e) {
$(this).parents(".rightLi").children(".respond_box").show();
e.stopPropagation();
$(".cancel_res").on("click", function (e) {
$(this).parents(".res_b").siblings(".res_area").val("");
$(this).parents(".respond_box").hide();
e.stopPropagation();
/*删除评论*/
$(".del_comment_c").on("click", function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_invalid/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parents(".conLi").remove();
alert(data.msg);
$(".res_btn").click(function (e) {
var parentWrap = $(this).parents(".respond_box"),
q = parentWrap.find(".form1").serializeArray(),
resStr = $.trim(parentWrap.find(".res_area_r").val());
console.log(q);
//var res_area_r = $.trim($(".res_area_r").val());
if (resStr == '') {
$(".res_text").css({color: "red"});
$.post("/index.php/comment/do_comment_reply/", q,
function (data) {
if (data.succ == 1) {
var $target,
evt = e || window.
$target = $(evt.target || evt.srcElement);
var $dd = $target.parents('dd');
var $wrapReply = $dd.find('.respond_box');
console.log($wrapReply);
//var mess = $(".res_area_r").val();
var mess = resS
var str = str.replace(/{%header%}/g, data.header)
.replace(/{%href%}/g, 'http://' + window.location.host + '/user/' + data.username)
.replace(/{%username%}/g, data.username)
.replace(/{%com_username%}/g, data.com_username)
.replace(/{%time%}/g, data.time)
.replace(/{%id%}/g, data.id)
.replace(/{%mess%}/g, mess);
$dd.after(str);
$(".respond_box").hide();
$(".res_area_r").val("");
$(".res_area").val("");
$wrapReply.hide();
alert(data.msg);
}, "json");
/*删除回复*/
$(".rightLi").on("click", '.del_comment_r', function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_comment_del/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parent().parent().parent().parent().parent().remove();
$(e.target).parents('.res_list').remove()
alert(data.msg);
//填充回复
function KeyP(v) {
var parentWrap = $(v).parents(".respond_box");
parentWrap.find(".res_area_r").val($.trim(parentWrap.find(".res_area").val()));
评论共有0条
综合评分:
积分/C币:3
二维映射三维
综合评分:
积分/C币:2
yufangweng
综合评分:
积分/C币:3
VIP会员动态
CSDN下载频道资源及相关规则调整公告V11.10
下载频道用户反馈专区
下载频道积分规则调整V1710.18
spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip
资源所需积分/C币
当前拥有积分
当前拥有C币
输入下载码
为了良好体验,不建议使用迅雷下载
搜狗实验室文本分类语料
会员到期时间:
剩余下载个数:
剩余积分:0
为了良好体验,不建议使用迅雷下载
积分不足!
资源所需积分/C币
当前拥有积分
您可以选择
程序员的必选
绿色安全资源
资源所需积分/C币
当前拥有积分
当前拥有C币
为了良好体验,不建议使用迅雷下载
资源所需积分/C币
当前拥有积分
当前拥有C币
为了良好体验,不建议使用迅雷下载
资源所需积分/C币
当前拥有积分
当前拥有C币
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
无法举报自己的资源
你当前的下载分为234。
你还不是VIP会员
开通VIP会员权限,免积分下载
你下载资源过于频繁,请输入验证码
您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:!
若举报审核通过,可返还被扣除的积分
被举报人:
请选择类型
资源无法下载 ( 404页面、下载失败、资源本身问题)
资源无法使用 (文件损坏、内容缺失、题文不符)
侵犯版权资源 (侵犯公司或个人版权)
虚假资源 (恶意欺诈、刷分资源)
含色情、危害国家安全内容
含广告、木马病毒资源
*投诉人姓名:
*投诉人联系方式:
*版权证明:
*详细原因:
搜狗实验室文本分类语料[技术报告]乱序优化与GCC的Bug
乱序优化是现代编译器非常重要的特性,本文介绍了什么是乱序优化,以及由此引发的一个gcc bug,希望引起各位开发者的注意。
全文链接:
&&最后修改于
请各位遵纪守法并注意语言文明}

我要回帖

更多关于 美国核实验室 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信