不少读者留言咨询工具怎么下载,我贴个下载链接如下:
工具下载地址:链接接:pan.baidu/s/1Gropn0qpV7ji7SlWVOw-iQ 提取码:6666从去年国庆第一次看到知乎的那篇文章:如何在百万级的数据里找到别人正在赚钱的项目(参考资东京房地产料1),认识到了君言,再顺藤摸瓜看完君言在知乎的几篇文章,对于一直在摸索尝试用技术从事自媒体写作的一个技术人,终于感觉找到了用技术做点东西的思路。今年4月18号加入了生财有术后,花了2个多月的碎片时间刷完生财28篇SEO的精华,外加几篇关键词引流与知乎好物的精华,再回头来重新把君言的所有文章读了几遍,断断续续把这些文章涉及的功能做成了一个小工具集合:生财工具,生财工具的脑图介绍如下:
关键词工具关键词工具一、关键词工具1.关键词内容挖掘工具
无论是通过SEO获取免费流量,还是通过SEM做竞价投放,我们都会先研究一下关键词目前在搜索引擎的收录情况,为了方便的收集一批关键词在搜索引擎的收录情况,就需要工具自动输入关键词然后收集搜索引擎返回的内容,我们通过收集这些链接,提取标题,还可以通过提取域名快速找到目前做到比较好的同行网站有哪些,研究同行网站的关键词布局与内容向来是做互联网项目的必备技能。
关键词内容挖掘工具的操作视频:
关键词内容挖掘工具的相关截图:
关键词工具关键词内容工具的使用很简单:输入你想挖掘的词根,比如换手率是什么:抖音,选择包含词根的长尾词文件,关键词内容挖掘工具会自动使用长尾词带入百度搜索挖掘出排名在首页的文章链接点击广告赚钱。
关键词挖掘工具爬取一段时间后我们得到如下的文件:
长尾词对应的百度搜索结果收录链接包括域名、域名描述、链接标题、链接地址以及在百度的排名权重,如下所示:
关键词工具域名统计文件提取链接的域名,再根据百度的排名权重将域名进行排名统计,我们可以很
方便的得到一份相红烧排骨怎么做关领域的行业域名库,如下所示:
关键词工具2.关键词内容下载
通过上面的关键词内容挖掘工具,我们已经找到一批搜索引擎收录的排名靠前的链接,为了更好的研究这些内容,我们通常希望将这些内容直接下载到本地电脑保存起来,这样一是为了方便查看,另外也可以快速的进行模仿再创作,所以还是需要一个工具批量下载这些链接的内容工具,关键词内容下载工具就是用来自动下载这些链接内容,并支持多种格式,如html,纯文本与word格式等。
关键词内容下载工具视频如下:
关键词内容下载工具截图如下:
关键词内容下载工具的使用也很简单:
网页地址文件将需要下载的网页地址保存到文件中,然后选择这个网页地址文件,这里直接可以用前面的关键词内容挖掘工具得到。网页地址列位置选择的网页地址文件可能有很多列信息,这里需要指定哪一列是网页链接地址。下载配置可以选择将网页内容保存为html、txt纯文本和word三种格式。下载一段时间后,我们就得到三种文件格式的内容,分别保存在三个文件夹中,如下:
3.关键词基于海量内容挖词
从事搜索引擎营销都知道,做好SEO和SEM最重要的事情就是关键词挖掘,挖的词越多,就越有可能发现更多的流量机会。关键词挖掘有很多种方法,这里介绍的是基于海量内容挖词方法,也是目前搜索引擎提取关键词的一种常用方法,专业的技术说法是:通过TF-IDF算法提取文章关键词。这个工具的思路也是来自君言的文章(文末的参考资料:6),这里我们利用一批新闻语料库和目标行业文章来保证收集的关键词的行业准确性,新闻语料库可以直接从一些自然语言处理网站下载现成的,另外就是需要收集你需要提取的关键词目标行业的文章,这些文章从哪里下载?很简单,上面的关键词内容下载工具就可以用来下载这些行业文章,另外也可以直接通过知乎来收集。
关键词基于海量内容挖词工具的的使用视频:
关键钱的味道词基于海量内容挖词工具的的使用截图:
目标内容文件夹目标内容就是我们准备提取的关键词蔓越莓粉内容,目前icc支持主流的文件格式:html、txt、word和pdf格式。
提取词百分比为了认为控制提取词的准确度,我们一般提取TF-IDF得分排名前20%的关键词,具体可以根据提取的效果调整这个比值。
语料库文件夹语料库需要预先准备,一般以新闻语料库为主。
语料库加载百分比为了加快语料库的加载速度,我们可以加载每份语料库的一部分,具体使用可以根据提取关键词的准确度调整这个比值。
过滤关键词包含文档数阈值算法不是万能的,当某些词很频繁的出现在很多语料库中时,我们认为通过这个阈值过滤掉这些关键词,保证提取的准确度。
这里我以小曾的一些文章作为目标内容,挖掘君言部分文章得到的关键词如下:
4.关键词相关搜索
如果你已经明确准备研究一个领域的需求,有什么方式可以把这个领域所涉及的需求尽可能都提取出来,无论用户是怎么表达的?君言的一篇付费文章(参考资料:5)给出了一种非常巧妙可操作性强的方法:搜索引擎的相关词搜索。
挖掘百度搜索引擎的相关词有一个难点:如何保证相关词的相关性?如果不做相关性校验,直接爬取的关键词会很快偏离我们的要求,比如:引流,这个词根很容易爬取到很多医学类关键词,所以必须控制关键词的相关性。
君言在付费文章提出了一种方法解决了这个问题:使用相关词搜索结果的链接域名判断,具体细节这里不作展开,感兴趣的可以直接看那篇付费文章,非常值得一看,如果你是生财有术星球的会员可以直接在星球找到这篇文章免费查看。
使用这个工具还有一个小困难点:怎么收集一个领域的行业域名库?很简单,上面的关键词内容挖掘工具就可以解决这个问题,工具在收集内容的同时自动提取链接的域名并按照搜索引擎的排名对域名进行排序,我们就得到了一份行业域名库了。
关键词相关词搜索工具芭莎慈善夜的操作视频:
关键词相关词搜索的工具的使用截屏如下:
词根就是我们需要爬取的关键词词根,比如:引流。
健康就好域名相关性校验如果开启域名相关性校验,我们会使用百度收录关键词链接的域名判断该关键词是否与要搜索的词根相关。
行业域名库文件行业域名库文件保证关键词的链接域名包含在这份域名库文件中,这个域名库文件可以通过前面的关键词内容挖掘工具整理得到,如下:
排除域名库文件排除域名库文件是为了排除很多大的域名基本覆盖了任何行业的搜索结果:比如百度、百度知道、知乎、新浪等。这个手动整理一次就可以了,再根据爬取结果调整这份域名库文件,如下所示:
银行面试技巧关键词相关词搜索工具会爬取得到如下几份文件:相关词文件异常词文件有些异常词是我们判断错误的文件,主要是域名库整理的不够准确完整,可以根据爬取结果调整:关键词完全匹配统计我们将关键词是否完整包含在搜索链接标题进行统计,并根据关键词长度进行排名,我们就可以得到一个关键词在百度搜索结果的竞争激烈程度,这里重点关注完全匹配数为0的关键词,这些关键词可能意味着还没有匹配的内容提供,这里我们就可以撰写相应的文章吸引收录。具体文件示例如下:异常词域名统计我们在判断词词不是相关词的同时,记录下这些我们判断为非相关词的链接的域名与域名的描述,从这份域名文件我们可以判断出哪些域名是我们收集行业域名库漏掉的,我们可以加进去提高判断关键词是否相关的准确性,不断丰富关键词行业域名库,如下:
相关词含空格为什么要将压力传感器原理这部分关键词单独提取出来一个文件?因为这些包含空格的关键词都包含用户强烈的搜索需求,想一想自己的搜索习惯,当搜不到自己需要的结果时,是不是下意识的加些空格希望搜索引擎更准确的给出搜索结果,一些示例关键词如下:
相关词爬取记录我们将关键词在百度的搜索结果也记录下来,便于二次分析,比如我们调整了行业域名库,就可以直接分析上次的爬取结考研资讯果,不用在重新爬取了,如下:
5.关键词分词
通过关键词找项目的重点在于挖掘海量用户的需求,再去做自动化归类,数据量越大,归类越智能,找到的需求就越清晰,而分词是关键词挖掘项目的必备操作。
一个简单的分词举例如下:
怎么下载抖音的视频 --> 怎么、下载网箱养殖、抖音、的、视频。
当我们拿到一批长尾词,通常需要对长尾词进行分词,统计词根词频,关键词往往符合2/8定律,结合分词统计的词根覆盖率就能把能覆盖80%词量的20%词根重新进行拓展,基本就能收集到有代表性的词库。
关键词分词工具的操作视频:
关键词分词工具的相关截图:
词根词根比如:抖音,这个词根就是准备分词的长尾词文件的词根。
词库语言目前支持中文与英文,英文的分词效果不太好,后面会专门抽出时间来优化这个英文分词功能。
关键词文件这次准备分词的长尾词文件,不限于长尾词也可以是一批短文本,比如链接标题、文章标题等短文本都可以。
关键词排除文件把你不想要的关键词词根,比如一些黑词的词根,还有我们明确知道不想要的词根,比如我们从5118上导出了一批“引流“长尾词,想对这些长尾词进行分析,我们已经知道比如一些医学词根比如:导管、试管、手术这些明显是不相关的词根,我们可以用一个文件把这些不相关的词放在一起排除掉,这样分类结果就不会有这些词了。
自定义不可分割词文件不可分割词是为了保证一些词不要被拆开,因为分词工具也不是万能的,比如:今日头条、视频号这两个词不要被拆开成:今日、头条,视频、号。我们将这些不想被拆开的词也整理成一个文件放到一起,这样就可以提高分词的准确性。
这里我们还是以"抖音"给出一份分词后的效果截屏:
我们简单解释一下上面excel的含义:
词频比如,第4行:视频,就是“视频”这个词根在这份“抖音”长尾词中出现的次数。
词频覆盖率比如,第4行:视频,该词根的词频占“抖音”长尾词数量的比例。有了词频覆盖率的参考,便能一眼看出该词根的比重,快速了解该词根的重要程度。
词频累计覆盖率有了词频覆盖率,为什么还要一个词频累计覆盖率指标了?因为关键词往往符合2/8定律,为了方便的统计一份长尾词库中覆盖了80%长尾词的词根,我们在生成这个文件的同时从上到下累计每个词根的覆盖率就得到了词频累计覆盖率,然后直接观察“词频统计覆盖率”这一列,从上到下拖到80%这个值就表示之前的所有行就是代表整个长尾词库80%的词根了。
我们还可以用词根:把能覆盖80%词量的20%词根都去拓展与一些描述词进行重新组合继续拓展更多的长尾词词,这样基本就能收集到有代表性的词库了。
6.关键词分类
在搜索引擎上,找到 50 万个属于某个行业长尾词词库绝对是一种很强的能力,现在我们已经可以通过一些第三词库网站拿到50万甚至更多的词库,但是如果对50万乃至百万级长尾词进行自动化分类,这是有点技术难度的,通过excel基本无法做到,我们其实通过机器学习的文本分类技术是能够在几十分钟内完成百万级长尾词的分类。
其实通过上面的一系列工具,我们已经准备了一批长尾词,下面将使用关键词分类工具对关键词进行分类,在分类的过程中会对关键词去重、去短、去长,还可以自定义排除词文件将非目标词移除等处理:
关键词分类工具的操作视频如下:负面情绪
关键词分类工具的相关截屏如下:
我们还是以一份50万的抖音长尾词为例,给出分类的效果截屏:
从上面的excel文件我们可以很方便的将一份几十万长尾词按照分类数量整理到一份excel中,每一列就是分成一类的长尾词,列的标题是这一列长尾词除了词根(抖音)之外出现最频繁的2个词根,还统计了这一类长尾词有多少个以及在整个长尾词库的占比。
另外,关键词分类工具同时将每一列单独生成一个文件方便查看,如下:
至于,如何我们应该如何使用分类后的文件,这里给出君言文章的一些片段说明:
这样一份Excel,已经自动帮我们归类好相似的关键词,不同类的词会间隔开,好处在于:
1:某些词可能只是小部分字眼不同,但实际表述的都是一件事,程序能帮你归类出来
2:聚集在一起的一批词,我们一眼就可以看出这是一个什么样的需求,越多越清晰
3:相关的已经归类在一起了,后面不会再出现类似需求,不会反复干扰
在生财有术的精华文章里,也有一篇关于“口水”小病种的淘宝蓝海选品的文章值得一读丝域(参考资料9的第4个链接)。
另外,经过归类的长尾词库也是一份非常好的自媒体写作思路来源,特别是那些带有疑问词的长尾词,比如:抖音怎么类的长尾词,这对于从事抖音相关自媒体培训创作的作者来说,在你没有写作思路的时候不妨从这些长尾词中找些灵感,毕竟这些长尾词都是用户真实的搜索需求。
7.关键词思维导图生成
通过关键词归类工具归类后的长尾词是没有结构的,一份词库生成之后,你只能从上往下看,看到什么是什么。
其实我们可以使用我们日常工作经常用的脑图工具来可视化呈现关键词的分类效约克夏果,关键字分类工具就是采用君言介绍的关键词根提取法“的方式来归类,使归类好的关键词自动按照思维导图的结构展示出来。
关键词思维导图工具的操作视频:
关键词思维导图工具的相关截图:
还是以抖音为例,生成一份关键词思维导图工具如下:
另外,根据多个用户的反馈,长尾词达到百万级以后生成的思维导图太大很难打开,所以参考了知乎问天文章(最近发现该文章已被删除)的做法做了多文件夹显示长尾词:
二、参考资料
由于平台限制,相关链接没有给出,可以自行搜索。
1.如何在百万级的数据里找到别人正在赚钱的项目
2.如何轻松找到抖音里不起眼的赚钱项目
3.学会这几点,就可以在百万数据里找到能赚钱的项目
4.零粉丝,运用错位竞争facewin,运营「好物推荐」
5.用逆向思坎普维收集大量被忽略的"声音"
6.百度竞价广告:穷尽蓝海流量-收集篇
7.SEO采集海量文章,用倒排索引找出"类似的标题"
8.我在阿里巴订做一个天堂巴的流量方法论
9.生财有术SEO精华
关键字基础篇,进阶篇,及12个应用方法知乎的千万级流量套利机会百度另类流量词挖掘方式分享海量长尾词蓝海选品10.TF-IDF的应用:自动提取关键词
11.通过Google挖掘接受现实细分市场的一个案例
最后以小曾的一段话来结束这篇文章:
研究好关键词就成功了⼀半! 那其实我们还有听过⼀句话:解决核⼼问题就解决了80%的问题。 对于这些领域,关键词就是核⼼问题 所以以我过往的经验来看:何⽌⼀半!。不少读者留言咨询工具怎么下载,我贴个下载链接如下:
工具下载地址:链接接:pan.baidu/s/1Gropn0qpV7ji7SlWVOw-iQ 提取码:6666如果你觉得这个工具对你启发或有疑问欢迎留言讨论,写代码不易,也请支持一下这篇文章~
本文发布于:2023-06-01 19:05:24,感谢您对本站的认可!
本文链接:http://www.ranqi119.com/ge/85/179880.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |