奔跑中的奶酪

奔跑中的奶酪 有智,有趣,有爱
当前位置 - 首页 - 博客 - 打造一款像谷歌那样的本地搜索引擎

打造一款像谷歌那样的本地搜索引擎

奔跑中的奶酪  发表于:2019-05-13  6820次浏览  1条评论 

  • 导读



    在电脑未发明前,查资料不是一件容易的事,要想从一本书中找到某个关键词要花不少时间,更别说从图书馆里找了。数字化时代的到来,让资料查找上升了一个“维度”。

    怎么形容这上升的一个维度呢?《三体Ⅲ》里有精彩的比喻,说从四维看三维,三维完全暴露在四维之下,能看到无限的细节,从四维干预三维,可以完全无伤地把一个人的脑子取出来。信息的数字化也是如此。

    实物档案的数字化是一次划时代的变革,它让我们能从海量信息中轻易就找到所需信息。不管是工作还是学习中,使用电子版的阅读材料和记录笔记,我们都能方便地进行知识的管理和查找。本文的主要内容正是为建立本地搜索引擎的提供一些思路

  • 一、文件搜索引擎

    本地搜索引擎的建立可以参考谷歌、百度搜索引擎的做法,大致步骤是:1、爬虫收集信息(我们自己制作/下载的电子文档)—> 2、建立索引数据库(软件自动生成)—> 3、用户使用搜索引擎(我们使用搜索软件)。

    文件搜索的使用频率最高,通常只要做好“命名和分类”就能进行高效搜索,我们在《文件管理》一文中已有介绍,适用于大多数文件,使用的搜索软件包括:Listary + Everything


    1、一般文件搜索:
    按 Ctrl + Q 唤出 Listary 工具栏进行搜索


    2、复杂文件搜索:
    在 Listary 中设置关键字"e" 调用 Everything 进行搜索。参数是:

    -s {query}




    3、当前目录文件搜索:
    在 Listary 中设置关键字"ee" 调用 Everything 进行搜索。参数是:

    -s " """%path%""" {query} "

    注意:不是调出 Listary 工具条搜索,而是直接在当前目录输入"ee",然后输入要搜索的内容。

  • 二、图片搜索引擎

    图片搜索和文件搜索的不同在于,很多时候搜索到的图片文件,需要查看才能知道是不是要找的图片,所以搜索软件最好要有预览功能。在新版 Everything 中就加入了图片预览功能。


    1、通常的搜索方法:

    通过 Listary 调用 Everything 进行搜索,使用通配符“pic:”可以进行图片过滤。



    2、快捷的搜索方法:

    省去每次搜索都要输入通配符“pic:”的烦恼,我们在使用 Listary 调用 Everything 时,可以直接加入搜索参数。

    -s pic:{query}




    3、文档搜索预览:

    Everything 也支持常见文档格式的搜索预览,包括 Word、PPT、Excel、PDF 等。

  • 三、全文搜索引擎

    和图片搜索一样,我们不仅仅要搜索文档的名称,还需要查看文档里面的内容。特别是你只是模糊记得一些词语,而要找的文件名是什么都不知道的时候,全文搜索就派上大用处了。换句话说,我们可以借助全文搜索功能来打造个人的电子图书馆

    FileLocator Pro 正是一款为此而生的搜索软件,也可能是目前 Windows 下最好用的全文搜索软件。除了支持绝大多数文档文件外,也支持压缩文件的内容搜索,提供三种搜索模式,也支持通配符表达式。




    1、一般的全文搜索:

    在 Listary 中设置关键字“f”调用 FileLocator Pro 进行搜索。这个方法主要是用于快速调用 FileLocator Pro,搜索范围和内容都在需要稍后进行。参数是:

    -c {query}




    2、当前目录的全文搜索:
    在 Listary 中设置关键字"ff" 调用 FileLocator Pro 进行搜索。这是使用最多的情况,我们通常只需要对某个目录进行全文搜索,如果全盘搜索的话,花费的时间实在太久了。参数是:

    -d "%path%" -c "{query}"


    注意:不是调出 Listary 工具条搜索,而是直接在当前目录输入"ff",然后输入要搜索的内容。



    3、建立索引数据库
    FileLocator Pro 支持文件 Unicode 十六进制编码内容搜索,但用得上的情况很少,我们甚至要排除掉这个功能,因为查看一个较大文件的 Unicode 十六进制编码时,容易因为读取内容过多而导致软件崩溃。此外,我还可以手动创造常用文件夹的数据索引来加快全文搜索的速度。

  • 结尾


    1、方便大家一键使用,附上文中提及软件的奶酪版配置
    2、本文为2019年05月09日第3版发布,由 奔跑中的奶酪 原创创作,欢迎 打赏,欢迎转载,欢迎订阅关注,欢迎留言评论。
    3、下载链接如若失效,微博 或者 公众号(runningcheese01)回复关键字“高效方法论”重
    4,欢迎订阅我的 “奶酪书签专业版”。(15年沉淀,超过3000多个分类井条有序的好用实用网站 html 书签)
二维码

扫描本页面二维码
用手机浏览本站

QR:打造一款像谷歌那样的本地搜索引擎

Top