为什么4008375258.com上线一天,之前的网站都是连网站名字都没取就收录,如果爱你只有这一次次取名优步中国就没收录奇怪

  最近一直在想做个网站充实一下业余的时间,毕竟每天上下班后的时间都很无聊,由于女朋友属于非主流脑残人群,因此为了迎合她的喜好,就打算搞一个非主流文化的站点。
  先期的工作可以大致分为以下几个步骤:
  1、CMS系统的选择:一直在drupal和dedecms之间犹豫,但最后还是选择了本土的dedecms,毕竟本土化做的好,而且相较之下,drupal虽然功能异常强大,但是对于我的应用来说,它实在是太复杂了。于是本地搭建了WAMP环境,装上了dedecms,对系统的操作进行了初步的熟悉,并且对网站的栏目进行了划分。
  2、采集器的选择:说实在的,作为个人站长,我实在没有太多的时间和精力去搞非主流素材的原创,于是考虑使用数据采集,试过了dedecms的采集功能,使用起来不是很方面,而且是基于web界面,在我网速不佳的情况下,页面竟然会僵死。现在的采集软件较几年前应该是强大很多了,于是我相信一定有更强大的采集软件,GG上一搜,果然有一款称为火车采集的软件。于是下载,熟悉。说句题外话,这个软件写的其实真不咋的,内存消耗极大,并且很多UI、UE的设计简直莫名其妙。不过好在,耍起来,基本功能都能满足,并且稳定性、抓取速度明显强于dedecms。在完全熟悉了它之后,就开始针对已划分的栏目进行对应的采集了。
  3、域名的注册及空间的租用:网上查了很多相关域名,都被注册掉了,最后选择了这个域名,意为&一起非主流&,也算是搭一点边界吧。空间租的是10G、mysql1G的那种,独立IP,速度还行。只是不能防盗链,这对于一个以图片为主的网站而言,不太理想。
  4、ICP备案:我选择的这家IDC还算是比较正规的,因此管理比较严格,如果没有ICP备案号,是不允许域名绑定的,于是让IDC代为进行备案,因为众所周知,备案的周期是惊人的缓慢。我已经做好等待3周的准备了。而这3周的时间,我可以用来同步进行dedecms模板的修改及程序的调整。但是没想到的是,我申请的ICP在提交2天之后就审核通过了。总结了一下,代我备案的IDC在ICP那里信誉度高,可能我以个人站长身份报备,周期就会长了。这里还有一个小心得,就是我报备的那个身份证号,之前是注册过,但是15位的,这次我报备的时候输入的是18位的,一样审核通过了。
  5、模板修改:由于ICP迅速的通过审核,让我的计划有点打乱,于是我加班加点地进行dedecms模板的修改,难度倒是没有什么,比较多的是一些css的调整。其中有一个自由列表功能,有点让我莫名,因为dede官网对于它的介绍也是非常模糊,论坛里也有大量的人在问这个功能到底怎么用。通过反复的摸索研究,终于对其理解了。其实自由列表在一定程度上,可以替代文章列表页和智能标签,因为它能套用不同风格的列表模板,这是列表页所不具备的,但智能标签可以实现。只是智能标签又不能做分页。dede的开发人员还真没想清楚。搞得这么复杂,具体怎么用自由列表,这里就不多阐述,提一个小心得,当自由列表替代一个栏目的列表页时,在每次生成栏目文章静态页之后,要去更新一下自由列表,否则没有效果。并且切记不要再去更新栏目静态页,否则自由列表也会没有效果。
  6、抓取数据的处理:dede的文章摘要比较奇怪,是自动摘录文章的前N个字,这对于我需要自定义摘要而言,有点画蛇添足。另外,一些抓取的文章中的图片的alt也需要替换,于是自己写了个外挂,可以检查各个栏目文章的keywords、description,并且可以进行修正。还能够批量检测、修正文章中图片的alt等等。而对于dede的程序也做了一些hack,每次添加文章的摘要和关键字都是根据预先写的好程序自动生成的。
  7、伪原创:对于图片文章,我的做法是修改文章标题,基本上改的面目全非,但不会脱离图片的主题。对于图文混和的文章,改标题、添加原创首尾段文字,中间的文字对于语义比较容易转换的,也尽量做了调整,尽量将两篇文章的相似度降低。
  8、部署:我不提倡网站一上线,就一股脑把所有抓取的数据都生成出来。首先,蜘蛛看你瞬间出现的庞大数据量,很容易判定站点为垃圾站,其次,刚上线的网站,弄那么多,给谁看呢?我的做法是,上线时,生成了百篇左右的文章,其余在后台全部设为&待审核&,这样在生成静态的时候,不会一起生成出来。然后每天就在后台里,从那些待审核的文章中,挑个二三十篇进行更新,这样蜘蛛看来,更像是网站的自然更新,而其实这些数据早一个星期前就准备好了,咔咔~但前提是,这些数据一定要经过伪原创处理,否则。。。但是,我又发现一个问题,即如果数据的抓取时间是8月5日,更新时间为8月9日,文件目录命名是以年月日这种方式的话,9日更新的文件,是会保存在5日那个文件夹内,这样不太美观,也不清楚对SEO是否会有影响。于是还是狠下心,读了一下dede的源码,将源码修改为每次修改完文章后,sortdate、senddate都取当前时间戳,这样就可以保证发布到当前日期的文件夹,并且文章发布日期也正确。我是archives和arctiny两个表都同步更新。只更新archives表有什么后果我也没有试过。
  9、上线:向各大搜索引擎提交了网站,其中GG和百度提交了2次。然后半夜在一个论坛回复了一个帖子,后面跟了域名及超链,就去睡了。白天醒来,发现没什么动静,于是就到网易、搜狐、新浪的博客里发了个日志,日志里大量提到了网站名称和超链。到了下午,观察log,终于发现google的蜘蛛来了。但百度还没有来,于是去了百度知道回复了一个提问,并且针对提问,给了一个一起非主流站内链接给提问者参考,还在贴吧跟贴带了域名和超链。到了下午,百度蜘蛛来了,并且又去GG站长管理工具验证了网站并且申请了GG Adsense。网上吃好饭,打开GG,发现已经被GG收录了,虽然只是首页,但总算也是收录了。其中我在GG中输入我的某些文章的标题,还能搜到那片文章所在的列表页地址。这个不知道算不算收录,我也不是非常清楚。但百度依然没有动静。再观察log,竟然发现了大量的404,我查了半天也不知道这些404蜘蛛是哪里找到的,后来花了1个小时,终于被我查到原因了:在网站正式生成静态之前,我曾经一口气生成过全部静态页作为测试之用,后来全部被我删除了,我以为这样就干净了,却没想到,我忘记删除或更新sitemap和rss文件,这两个文件里面,存在之前生成的大量链接!当我更新了这两个文件之后,蜘蛛的爬行也顺畅多了,出现了很多200,但404依旧夹杂其中,应该是之前的网站索引已经被完全被抓取导致蜘蛛还在继续爬行那些404页面。我很胸闷。只能怪自己太粗心,没有注意到这个细节。所以以此为戒,希望各位站长朋友务必要注意这两个文件。
  关于GG快速收录,不乏运气因素,但总结下来,这几方面也也值得思索:博客日志的外链作用还是有一定效果的,而GG站长管理工具和GG adsense都是google自家的产品,相信其也有一定的权重。而百度,就真的是看造化了。
  好了,洋洋洒洒地谈了这么多,并不是要具体讨论如何选择cms、如何选购域名空间、如何使用采集器、如何修改dede,如何做seo。而是将我的建站过程与大家分享,在这个过程中,可以看到一些操作步骤是可以提前,又有一些是可以并行,还可以看到建站过程中可能会遇到的问题及陷阱。本文无非是起到抛砖引玉的作用。希望帮助那些新手站长理理建站的头绪,更清楚自己哪一步该做什么以及哪些必须要做,哪些避免去做。
  欢迎大家访问我文中提到的这个新建站点:一起非主流 ,联系方式:。
责任编辑:编辑部
作者:一起非主流
延伸阅读:关键词:
分类排行榜
作者:木木博客
作者:木木
作者:何杨
作者:何杨
作者:苗元威
安全、高效、便捷的交易中介平台
中小企业首选SEO、全网营销服务
技术外包平台 一站式网站技术服务
高收益、移动广告、弹窗CPM
做有良心的cms技术服务提供商
提供公众号出售、求购、代售等交易中介以及增值服务。
增值电信业务经营许可证:苏B2-
编辑热线:6-808
A5创业网 版权所有.
扫一扫关注最新创业资讯取名都被占所以就取个长的名字的喜欢 | LOFTER(乐乎) - 记录生活,发现同好
LOFTER for ipad —— 记录生活,发现同好
取名都被占所以就取个长的名字 的喜欢
&nbsp&nbsp被喜欢
&nbsp&nbsp被喜欢
{list posts as post}
{if post.type==1 || post.type == 5}
{if !!post.title}${post.title|escape}{/if}
{if !!post.digest}${post.digest}{/if}
{if post.type==2}
{if post.type == 3}
{if !!post.image}
{if post.type == 4}
{if !!post.image}
{if !!photo.labels && photo.labels.length>0}
{var wrapwidth = photo.ow < 500?photo.ow:500}
{list photo.labels as labs}
{var lbtxtwidth = Math.floor(wrapwidth*(labs.ort==1?labs.x:(100-labs.x))/100)-62}
{if lbtxtwidth>12}
{if !!labs.icon}
{list photos as photo}
{if photo_index==0}{break}{/if}
品牌${make||'-'}
型号${model||'-'}
焦距${focalLength||'-'}
光圈${apertureValue||'-'}
快门速度${exposureTime||'-'}
ISO${isoSpeedRatings||'-'}
曝光补偿${exposureBiasValue||'-'}
镜头${lens||'-'}
{if data.msgRank == 1}{/if}
{if data.askSetting == 1}{/if}
{if defined('posts')&&posts.length>0}
{list posts as post}
{if post_index < 3}
{if post.type == 1 || post.type == 5}
{if !!post.title}${post.title|escape}{/if}
{if !!post.digest}${post.digest}{/if}
{if post.type == 2}
{if post.type == 3}
{if post.type == 4}
{if post.type == 6}
{if drlist.length>0}
更多相似达人:
{list drlist as dr}{if drlist.length === 3 && dr_index === 0}、{/if}{if drlist.length === 3 && dr_index === 1}、{/if}{if drlist.length === 2 && dr_index === 0}、{/if}{/list}
暂无相似达人,
{if defined('posts')&&posts.length>0}
{list posts as post}
{if post.type == 2}
{if post.type == 3}
{if post.type == 4}
{if post.type == 6}
this.p={ dwrMethod:'queryLikePosts',fpost:'1dcfc144_bd6c662',userId:,blogListLength:30};如何让网站上线一天之内被收录_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
如何让网站上线一天之内被收录
上传于|0|0|文档简介
&&如何让网站上线一天之内被收录
你可能喜欢如何找出网站不收录的罪魁祸首?
不知道大家有没有过这样的感受:辛辛苦苦做了一个网站,上线之后满怀期待等着被搜索引擎收录,一天一天又一天,时间过去了,可收录一直都没有什么动静,这个时候不免就变得失落、急躁起来,本人刚开始做SEO的时候亦是如此。就像你种下一颗种子等着它生根发芽,季节如期而至,可它仍在长眠,就算每天给它最丰富的肥料,它依然毫无起色,这样就基本可以断定:种子本身就有问题。
其实一个网站也是一样,网站上线以后,你每天给他添加发布文章,寻找外链,到头来网站收录还是外甥打灯笼,那么也就可以大致的判定:网站本身就存在问题。既然这样,那么现在问题来了:到底网站是哪里出问题了呢?本人刚开始的时候也是差点抠破了头皮,但是通过翻阅大量的有关资料之后,总算是找到了其中的原因,并最终得以解决。本人通过分析整理出来了其中绝大多数的原因,在此全部分享出来,希望能切实的帮助您解决到问题。
一、空间不稳定。
空间就好比人住的房子,房子装修的漂亮,客人就喜欢经常来光顾,蜘蛛就好比一个远道而来的客人,如果你家的门连打开都很费力,那么客人怎么可能还有兴趣进屋里面看看呢。同样的道理,如果你的空间既卡又慢,那么蜘蛛大人哪里还有心思爬进你的网站参观呢。
二、复杂冗长的代码
代码是网站后台最主要的元素,干净利落的代码才会是蜘蛛的最爱。在这儿不妨举个例子,如果你要开车去一个地方旅游,你是愿意走高速公路呢,还是走路面满是坑洼、路上都是障碍的路呢?所以有时候你也得站在蜘蛛的立场考虑下问题。
三、网站结构不合理
一个网站如果结构混乱,那么整个网站就会是乱七八糟毫无章法,用户体验极差,更重要的是蜘蛛也不会喜欢,看着都头晕目眩的,你说它哪儿还有心思去抓取你网站的内容呢?网站最合理的结构应该是扁平的物理结构和金字塔状的逻辑结构,层次鲜明而且又非常美观实用。
四、网站内容质量差
如果你网站上的内容都是通过简单的复制粘贴或者大量采集转载别人的网站内容,那么收录肯定是问题的。因为蜘蛛的喜新厌旧都是众所周知的,如果你没有新鲜的东西吸引它,它是很难过来爬取你的网站的,就更谈不上收录了。
五、网站上线后的不合理操作
对于这个问题本人是深有体会。当初信心满满的做了一个网站,在本地测试之后以为一切都万事俱备了,可是等上线以后就发现不是这儿有问题就是那儿没调好,都是一些细节上的小问题,所以网站被频繁改动。当然最严重的错误还是在于改动了文章的标题(因为刚入门什么都不太懂),最终导致的后果就是网站过了两个多月百度还是只收录了一个首页(多么痛的领悟)。所以网站的随意更改特别是对于标题、关键字、描述的修改对网站的优化有很大的影响。
六、网站域名存在不良的历史记录
这一点主要是针对老域名而言的。有的老域名之前可能被拿去做过黑帽之类的网站导致被K,被搜索引擎拉进了黑名单,给其留下了不好的印象,由于这种记录会被长时间保留,以至于当其他的人再次启用这个域名的时候也会受到牵连。
七、网站过度优化
我曾经听一个高手说过这样一句话:过度的优化等同于作弊。其实不管做什么都得有个度,不仅是做SEO工作,做任何其它的事情也是一样的道理。没有限度的去做一件事情,到头来终将适得其反。网站的过度优化包括:代码、内外链和关键字的过度优化。所以大家一定要把握好一个尺度,特别是新手朋友,这个度就要更加把握好了。
以上的七点常见的导致网站不收录的原因有的是本人曾经碰到过的,有的是通过一些资料了解得到又通过一些实践证实了的。当然了,一个人的智慧总是有限的,并且随着搜索引擎的不断升级导致网站不收录的原因还会有很多,所以咱们也不能就局限于这几点,多观察多分析多总结才是解决更多问题的必备良药。
本文由武汉SEO小明
原创在站长之家投稿发布,转载还请注明出处,请大家尊重原创,珍惜别人的汗水!
注:相关网站建设技巧阅读请移步到频道。
看过本文的人还看过
最新图文推荐
最新专栏文章
大家感兴趣的内容
网友热评的文章}

我要回帖

更多关于 这一次买了什么 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信