奔跑中的奶酪

打造一款像谷歌那样的本地搜索引擎

导读

打造一款像谷歌那样的本地搜索引擎
在电脑未发明前,查资料不是一件容易的事,要想从一本书中找到某个关键词要花不少时间,更别说从图书馆里找了。数字化时代的到来,让资料查找上升了一个“维度”。

怎么形容这上升的一个维度呢?《三体Ⅲ》里有精彩的比喻,说从四维看三维,三维完全暴露在四维之下,能看到无限的细节,从四维干预三维,可以完全无伤地把一个人的脑子取出来。信息的数字化也是如此。

实物档案的数字化是一次划时代的变革,它让我们能从海量信息中轻易就找到所需信息。不管是工作还是学习中,使用电子版的阅读材料和记录笔记,我们都能方便地进行知识的管理和查找。本文的主要内容正是为建立本地搜索引擎的提供一些思路

一、文件搜索引擎

本地搜索引擎的建立可以参考谷歌、百度搜索引擎的做法,大致步骤是:1、爬虫收集信息(我们自己制作/下载的电子文档)—> 2、建立索引数据库(软件自动生成)—> 3、用户使用搜索引擎(我们使用搜索软件)。

文件搜索的使用频率最高,通常只要做好“命名和分类”就能进行高效搜索,我们在《文件管理》一文中已有介绍,适用于大多数文件,使用的搜索软件包括:Listary + Everything

1、一般文件搜索:

按 Ctrl + Q 唤出 Listary 工具栏进行搜索

2、复杂文件搜索:

在 Listary 中设置关键字"e" 调用 Everything 进行搜索。参数是:

-s {query}

打造一款像谷歌那样的本地搜索引擎


3、当前目录文件搜索:
在 Listary 中设置关键字"ee" 调用 Everything 进行搜索。参数是:

-s " """%path%""" {query} "

打造一款像谷歌那样的本地搜索引擎

注意:不是调出 Listary 工具条搜索,而是直接在当前目录输入"ee",然后输入要搜索的内容。
打造一款像谷歌那样的本地搜索引擎

二、图片搜索引擎

图片搜索和文件搜索的不同在于,很多时候搜索到的图片文件,需要查看才能知道是不是要找的图片,所以搜索软件最好要有预览功能。在新版 Everything 中就加入了图片预览功能。

1、通常的搜索方法:

通过 Listary 调用 Everything 进行搜索,使用通配符“pic:”可以进行图片过滤。
打造一款像谷歌那样的本地搜索引擎


2、快捷的搜索方法:

省去每次搜索都要输入通配符“pic:”的烦恼,我们在使用 Listary 调用 Everything 时,可以直接加入搜索参数。

-s pic:{query}

打造一款像谷歌那样的本地搜索引擎


3、文档搜索预览:

Everything 也支持常见文档格式的搜索预览,包括 Word、PPT、Excel、PDF 等。
打造一款像谷歌那样的本地搜索引擎

附:

Listary 内置变量:
{action_path}: 搜索结果路径
{action_path:parent}: 搜索结果的父文件夹
{current_folder}: 资源管理器中正在浏览的文件夹
{query}: 搜索查询

Windows 资源管理器变量:
%path% : Current folder path
%file% : Path of the selected file
%filename% : File name of the selected file

新建静态文件名的例子:
关键字: +
显示名称: 新建文件 "new.txt"
路径: %windir%\System32\fsutil.exe
参数: file CreateNew new.txt 0

新建动态文件名的例子:
关键字: ++
显示名称: 新建文件 "{query}.txt"
描述: 在关键字后输入文件名
路径: %windir%\System32\fsutil.exe
参数: file CreateNew "{query}.txt" 0

三、全文搜索引擎

和图片搜索一样,我们不仅仅要搜索文档的名称,还需要查看文档里面的内容。特别是你只是模糊记得一些词语,而要找的文件名是什么都不知道的时候,全文搜索就派上大用处了。换句话说,我们可以借助全文搜索功能来打造个人的电子图书馆

FileLocator Pro 正是一款为此而生的搜索软件,也可能是目前 Windows 下最好用的全文搜索软件。除了支持绝大多数文档文件外,也支持压缩文件的内容搜索,提供三种搜索模式,也支持通配符表达式。

打造一款像谷歌那样的本地搜索引擎


1、一般的全文搜索:

在 Listary 中设置关键字“f”调用 FileLocator Pro 进行搜索。这个方法主要是用于快速调用 FileLocator Pro,搜索范围和内容都在需要稍后进行。参数是:

-c {query}

打造一款像谷歌那样的本地搜索引擎


2、当前目录的全文搜索:
在 Listary 中设置关键字"ff" 调用 FileLocator Pro 进行搜索。这是使用最多的情况,我们通常只需要对某个目录进行全文搜索,如果全盘搜索的话,花费的时间实在太久了。参数是:

-d "%path%" -c "{query}"

打造一款像谷歌那样的本地搜索引擎
注意:不是调出 Listary 工具条搜索,而是直接在当前目录输入"ff",然后输入要搜索的内容。
打造一款像谷歌那样的本地搜索引擎


3、建立索引数据库
FileLocator Pro 支持文件 Unicode 十六进制编码内容搜索,但用得上的情况很少,我们甚至要排除掉这个功能,因为查看一个较大文件的 Unicode 十六进制编码时,容易因为读取内容过多而导致软件崩溃。此外,我还可以手动创造常用文件夹的数据索引来加快全文搜索的速度。

打造一款像谷歌那样的本地搜索引擎

结尾

1、方便大家一键使用,附上文中提及软件的奶酪版配置
2、本文为2019年05月09日第3版发布,由 奔跑中的奶酪 原创创作,欢迎 打赏,欢迎转载,欢迎留言评论。
3、下载链接如若失效,微博 或者 公众号(runningcheese01)回复关键字“高效方法论”重新获取。
4,欢迎订阅我的 “奶酪书签专业版”。(15年沉淀,超过3000多个分类井条有序的好用实用网站 html 书签)

注:本文由 奔跑中的奶酪 作者:奔跑中的奶酪 发表,其版权均为作者所有,如需转载,请注明作者名字以及文章来源。
19

评论:

3 条评论,访客:3 条,站长:0 条
  1. wnlei
    wnlei发布于: 

    奶酪,百度网盘的配置失效了。可以重新发一下么?谢谢!

  2. 萨龙龙
    萨龙龙发布于: 

    实物档案的数字化是一次划时代的变革,它让我们能从海量信息中轻易就找到所需信息。

  3. 血色浪漫
    血色浪漫发布于: 

    支持一波

发表评论