+

CN104699688A - 一种搜索文件的方法和电子设备 - Google Patents

一种搜索文件的方法和电子设备 Download PDF

Info

Publication number
CN104699688A
CN104699688A CN201310648940.7A CN201310648940A CN104699688A CN 104699688 A CN104699688 A CN 104699688A CN 201310648940 A CN201310648940 A CN 201310648940A CN 104699688 A CN104699688 A CN 104699688A
Authority
CN
China
Prior art keywords
file
key word
sector
fdisk
hard disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310648940.7A
Other languages
English (en)
Inventor
陈伟
汪海
范海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Ying Wan Science And Technology Ltd
Original Assignee
Hangzhou Ying Wan Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Ying Wan Science And Technology Ltd filed Critical Hangzhou Ying Wan Science And Technology Ltd
Priority to CN201310648940.7A priority Critical patent/CN104699688A/zh
Publication of CN104699688A publication Critical patent/CN104699688A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种搜索文件的方法和电子设备,电子设备包含磁盘,所述磁盘包括硬盘或者硬盘分区;方法包括:根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区;根据目的扇区和所述关键字在文件系统中找到对应的文件。不通过文件系统,而是直接搜索硬盘或者硬盘分区的各个扇区,实现最彻底的查找文件。并且可以据此直接在扇区中搜索未删除、已删除和已废弃的数据块。

Description

一种搜索文件的方法和电子设备
技术领域
本发明涉及数据存储技术,特别是指一种搜索文件的方法和电子设备。
背景技术
在计算机上确认是否存在包含关键字的文件时,通常是采用操作系统自带的搜索工具来实现的。然而现有技术只能搜索未删除的文件,不能搜索已删除的文件。
如果修改/删除了某文件的敏感词,现有技术无法确认是否还有残留信息,比如无法确认word的临时文件(tmp)可能含有的关键字,由于无法确认修改之后的文件是否还有修改之前的残留信息,这为文档编辑管理带来了隐患和不便。
现有技术存在如下问题:无法从整个硬盘或者硬盘分区搜索出全部含有关键字的现存或者已删除文件。
发明内容
本发明要解决的技术问题是提供一种搜索文件的方法和电子设备,解决无法从硬盘或者硬盘分区中搜索出全部含有关键字的现存或者已删除文件的问题。
为解决上述技术问题,本发明的实施例提供一种搜索文件的方法,应用于电子设备,电子设备包含磁盘,所述磁盘包括硬盘或者硬盘分区;方法包括:根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区;根据目的扇区和所述关键字在文件系统中找到对应的文件。
所述的方法中,根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区具体包括:确定一个或者多个关键字,将所述一个或者多个关键字转换成对应的二进制格式的比较字符;确定磁盘中的硬盘序号或者硬盘分区序号,根据所述硬盘序号或者硬盘分区序号直接读取硬盘信息或者硬盘分区信息;将所述比较字符与所述硬盘信息或者硬盘分区信息进行字符串匹配;确定所述比较字符对应的关键字所在的目的扇区和在目的扇区内的具体位置,输出所述目的扇区的具体地址和目的扇区内的偏移地址。
所述的方法中,根据目的扇区和所述关键字在文件系统中找到对应的文件具体包括:在文件系统中,根据所述的具体地址和目的扇区内的偏移地址找到目的扇区的逻辑扇区号,根据所述目的扇区的逻辑扇区号在磁盘的主控文件表中分析所述目的扇区所属的具体文件。
所述的方法中,还包括:删除查询到的含有关键字的具体文件,删除所述具体文件;选择删除的具体文件所在的硬盘或者硬盘分区,对该硬盘或者硬盘分区进行清零。
所述的方法中,还包括:选择已删除的文件,找到已删除的文件所在的主控文件表;在主控文件表中选择已删除的具体文件对应的目录,根据主控文件信息将已删除的具体文件所对应的数据恢复到新的文件中。
一种电子设备,包含磁盘,所述磁盘包括硬盘或者硬盘分区;还包括:搜索单元,用于根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区;文件匹配单元,用于根据目的扇区和所述关键字在文件系统中找到对应的文件。
所述的电子设备中,搜索单元还包括:预处理模块,用于确定一个或者多个关键字,将所述一个或者多个关键字转换成对应的二进制格式的比较字符;确定所述磁盘中的硬盘序号或者硬盘分区序号,根据所述硬盘序号或者硬盘分区序号直接读取硬盘信息或者硬盘分区信息;关键字匹配模块,用于将所述比较字符与所述硬盘信息或者硬盘分区信息进行字符串匹配;确定所述比较字符对应的关键字所在的目的扇区和在目的扇区内的具体位置,输出所述目的扇区的具体地址和目的扇区内的偏移地址。
所述的电子设备中,文件匹配单元包括:文件查找模块,用于在文件系统中,根据所述的具体地址和目的扇区内的偏移地址找到目的扇区的逻辑扇区号,根据所述目的扇区的逻辑扇区号在磁盘的主控文件表中分析所述目的扇区所属的具体文件。
所述的电子设备中,还包括:删除单元,用于删除查询到的含有关键字的具体文件,删除所述具体文件;选择删除的具体文件所在的硬盘或者硬盘分区,对该硬盘或者硬盘分区进行清零。
所述的电子设备中,还包括:恢复单元,用于选择已删除的文件,找到已删除的文件所在的主控文件表;在主控文件表中选择已删除的具体文件对应的目录,根据主控文件信息将已删除的具体文件所对应的数据恢复到新的文件中。
本发明的上述技术方案的有益效果如下:不通过文件系统,直接搜索硬盘或者硬盘分区的各个扇区,实现最彻底的查找文件。
附图说明
图1表示一种搜索文件的方法流程示意图;
图2表示搜索文件以及删除/恢复文件的流程示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明实施例提供一种搜索文件的方法,应用于电子设备,如图1所示,电子设备包含磁盘,所述磁盘包括硬盘或者硬盘分区;
方法包括:
步骤101,根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区;
步骤102,根据目的扇区和所述关键字在文件系统中找到对应的文件。
应用所提供的技术,不通过文件系统,而是直接搜索硬盘或者硬盘分区的各个扇区,实现最彻底的查找文件。并且可以据此直接在扇区中搜索未删除、已删除和已废弃的数据块。
在一个优选实施例中,根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区具体包括:
确定一个或者多个关键字,将所述一个或者多个关键字转换成对应的二进制格式的比较字符;
确定所述磁盘中的硬盘序号或者硬盘分区序号,根据所述硬盘序号或者硬盘分区序号直接读取硬盘信息或者硬盘分区信息;
将所述比较字符与所述硬盘信息或者硬盘分区信息进行字符串匹配;
确定所述比较字符对应的关键字所在的目的扇区和在目的扇区内的具体位置,输出所述目的扇区的具体地址和目的扇区内的偏移地址。
将所述比较字符与所述硬盘信息或者硬盘分区信息进行字符串匹配是将关键字和硬盘上的信息进行匹配的一个查找过程,包括:
关键字字符串转换成utf8、unicode或者ansi等格式的2进制数据,将2进制数据直接和硬盘数据进行比较(2进制数据之间的比较),找出符合要求的数据块-目的扇区的具体地址和目的扇区内的偏移地址。
在一个优选实施例中,根据目的扇区和所述关键字在文件系统中找到对应的文件具体包括:
在文件系统中,根据所述的具体地址和目的扇区内的偏移地址找到目的扇区的逻辑扇区号,根据所述目的扇区的逻辑扇区号在磁盘的主控文件表中分析所述目的扇区所属的具体文件。
找出符合要求的数据块之后,读取硬盘的主控文件表(MFT),分析数据块所在的具体文件,找到相应的具体文件。因为是直接查找底层磁盘上的010101格式的字符,而不是直接搜索文件,根据在磁盘上搜索到的磁盘信息(硬盘信息或者硬盘分区信息)去衔接与文件系统,在文件系统中查找出具体的文件。
在文件系统中,根据所述的具体地址和目的扇区内的偏移地址找到数据所对应的MFT,分析MFT信息(文件名,属性等等)找到目的扇区的逻辑扇区号,根据所述目的扇区的逻辑扇区号找到对应的具体文件。对应的具体文件包含已删除的文件,查询不到扇区对应的文件表示已废弃的数据块。
彻底删除查询到的已删除文件,已删除文件往往只是在分区的索引部分删除了该文件的信息,但是该文件的内容并没有被删除,因此在一个优选实施例中,还包括:
删除查询到的含有关键字的具体文件,删除所述具体文件;
选择删除的具体文件所在的硬盘或者硬盘分区,对该硬盘或者硬盘分区进行清零。
在一个优选实施例中,还包括:选择已删除的文件,找到已删除的文件所在的主控文件表;
在主控文件表中选择已删除的具体文件对应的目录,根据主控文件信息将已删除的具体文件所对应的数据恢复到新的文件中。
可设置一个阈值,当所述文件大小大于阈值时选择恢复文件目录,当所述文件小于等于阈值时直接在内存创建临时文件。
在一个应用场景中,如图2所示,包括:
步骤1,在界面中输入查询的磁盘或者硬盘分区(序号),关键字,界面传给搜索模块;
步骤2,搜索模块传给文件匹配模块含有关键扇区的一个DataInfo数组;
步骤3,文件匹配模块分析文件系统,搜索到目的扇区。并返回DataInfo数组,用于在界面显示信息;Datainfo数组显示中包括:所在磁盘,起始扇区,起始字节,对应文件名,文件类型(删除/正常),编码格式,文件属性(创建、修改或者访问)。
步骤4,文件恢复/删除模块:选择匹配到关键字的文件,直接打开正常文件,如已删除则恢复文件并打开。手动恢复然后自己打开/未知文件直接显示关键字前后文的硬盘数据。
本发明实施例提供一种电子设备,包含磁盘,所述磁盘包括硬盘或者硬盘分区;还包括:
搜索单元,用于根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区;
文件匹配单元,用于根据目的扇区和所述关键字在文件系统中找到对应的文件。
在一个优选实施例中,搜索单元还包括:
预处理模块,用于确定一个或者多个关键字,将所述一个或者多个关键字转换成对应的二进制格式的比较字符;确定所述磁盘中的硬盘序号或者硬盘分区序号,根据所述硬盘序号或者硬盘分区序号直接读取硬盘信息或者硬盘分区信息;
关键字匹配模块,用于将所述比较字符与所述硬盘信息或者硬盘分区信息进行字符串匹配;确定所述比较字符对应的关键字所在的目的扇区和在目的扇区内的具体位置,输出所述目的扇区的具体地址和目的扇区内的偏移地址。
在一个优选实施例中,文件匹配单元包括:
文件查找模块,用于在文件系统中,根据所述的具体地址和目的扇区内的偏移地址找到目的扇区的逻辑扇区号,根据所述目的扇区的逻辑扇区号在磁盘的主控文件表中分析所述目的扇区所属的具体文件。
在一个优选实施例中,还包括:
删除单元,用于删除查询到的含有关键字的具体文件,删除所述具体文件;选择删除的具体文件所在的硬盘或者硬盘分区,对该硬盘或者硬盘分区进行清零。
在一个优选实施例中,还包括:
恢复单元,用于选择已删除的文件,找到已删除的文件所在的主控文件表;
在主控文件表中选择已删除的具体文件对应的目录,根据主控文件信息将已删除的具体文件所对应的数据恢复到新的文件中。
采用本方案之后的优势是:不通过文件系统,直接搜索硬盘或者硬盘分区的各个扇区,直接在扇区中搜索未删除、已删除和已废弃的数据块,实现最彻底的查找文件。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种搜索文件的方法,其特征在于,应用于电子设备,电子设备包含磁盘,所述磁盘包括硬盘或者硬盘分区;
方法包括:
根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区;
根据目的扇区和所述关键字在文件系统中找到对应的文件。
2.根据权利要求1所述的方法,其特征在于,根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区具体包括:
确定一个或者多个关键字,将所述一个或者多个关键字转换成对应的二进制格式的比较字符;
确定所述磁盘中的硬盘序号或者硬盘分区序号,根据所述硬盘序号或者硬盘分区序号直接读取硬盘信息或者硬盘分区信息;
将所述比较字符与所述硬盘信息或者硬盘分区信息进行字符串匹配;
确定所述比较字符对应的关键字所在的目的扇区和在目的扇区内的具体位置,输出所述目的扇区的具体地址和目的扇区内的偏移地址。
3.根据权利要求1所述的方法,其特征在于,根据目的扇区和所述关键字在文件系统中找到对应的文件具体包括:
在文件系统中,根据所述的具体地址和目的扇区内的偏移地址找到目的扇区的逻辑扇区号,根据所述目的扇区的逻辑扇区号在磁盘的主控文件表中分析所述目的扇区所属的具体文件。
4.根据权利要求1所述的方法,其特征在于,还包括:
删除查询到的含有关键字的具体文件,删除所述具体文件;
选择删除的具体文件所在的硬盘或者硬盘分区,对该硬盘或者硬盘分区进行清零。
5.根据权利要求1所述的方法,其特征在于,还包括:
选择已删除的文件,找到已删除的文件所在的主控文件表;
在主控文件表中选择已删除的具体文件对应的目录,根据主控文件信息将已删除的具体文件所对应的数据恢复到新的文件中。
6.一种电子设备,其特征在于,包含磁盘,所述磁盘包括硬盘或者硬盘分区;
还包括:
搜索单元,用于根据关键字在磁盘的各个扇区中进行搜索,搜索到含有关键字的目的扇区;
文件匹配单元,用于根据目的扇区和所述关键字在文件系统中找到对应的文件。
7.根据权利要求6所述的电子设备,其特征在于,搜索单元还包括:
预处理模块,用于确定一个或者多个关键字,将所述一个或者多个关键字转换成对应的二进制格式的比较字符;确定所述磁盘中的硬盘序号或者硬盘分区序号,根据所述硬盘序号或者硬盘分区序号直接读取硬盘信息或者硬盘分区信息;
关键字匹配模块,用于将所述比较字符与所述硬盘信息或者硬盘分区信息进行字符串匹配;
确定所述比较字符对应的关键字所在的目的扇区和在目的扇区内的具体位置,输出所述目的扇区的具体地址和目的扇区内的偏移地址。
8.根据权利要求6所述的电子设备,其特征在于,文件匹配单元包括:
文件查找模块,用于在文件系统中,根据所述的具体地址和目的扇区内的偏移地址找到目的扇区的逻辑扇区号,根据所述目的扇区的逻辑扇区号在磁盘的主控文件表中分析所述目的扇区所属的具体文件。
9.根据权利要求6所述的电子设备,其特征在于,还包括:
删除单元,用于删除查询到的含有关键字的具体文件,删除所述具体文件;选择删除的具体文件所在的硬盘或者硬盘分区,对该硬盘或者硬盘分区进行清零。
10.根据权利要求6所述的电子设备,其特征在于,还包括:
恢复单元,用于选择已删除的文件,找到已删除的文件所在的主控文件表;
在主控文件表中选择已删除的具体文件对应的目录,根据主控文件信息将已删除的具体文件所对应的数据恢复到新的文件中。
CN201310648940.7A 2013-12-04 2013-12-04 一种搜索文件的方法和电子设备 Pending CN104699688A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310648940.7A CN104699688A (zh) 2013-12-04 2013-12-04 一种搜索文件的方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310648940.7A CN104699688A (zh) 2013-12-04 2013-12-04 一种搜索文件的方法和电子设备

Publications (1)

Publication Number Publication Date
CN104699688A true CN104699688A (zh) 2015-06-10

Family

ID=53346826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310648940.7A Pending CN104699688A (zh) 2013-12-04 2013-12-04 一种搜索文件的方法和电子设备

Country Status (1)

Country Link
CN (1) CN104699688A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273523A (zh) * 2017-06-22 2017-10-20 北京北信源软件股份有限公司 一种网络访问记录清除方法及装置
CN107301351A (zh) * 2017-06-22 2017-10-27 北京北信源软件股份有限公司 一种扫描与清除网络访问记录的方法与装置
CN108280192A (zh) * 2018-01-25 2018-07-13 中孚信息股份有限公司 一种根据扇区逆向定位文件的实现方法
CN108491324A (zh) * 2018-03-12 2018-09-04 威创集团股份有限公司 一种软件中的目标词汇搜索方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070030734A1 (en) * 2005-08-03 2007-02-08 Sinclair Alan W Reclaiming Data Storage Capacity in Flash Memories
CN101464900A (zh) * 2009-01-15 2009-06-24 上海交通大学 Ntfs文件系统下轻量级文件隐藏方法
CN102289451A (zh) * 2011-06-17 2011-12-21 奇智软件(北京)有限公司 文件或文件夹查找方法和装置
CN102298546A (zh) * 2011-09-07 2011-12-28 深圳市万兴软件有限公司 从磁盘上恢复被删除的jpg文件的方法及计算机
CN102609531A (zh) * 2012-02-14 2012-07-25 北京鼎普科技股份有限公司 一种根据关键字反查文件的方法
CN102880713A (zh) * 2012-09-29 2013-01-16 北京奇虎科技有限公司 文件清理方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070030734A1 (en) * 2005-08-03 2007-02-08 Sinclair Alan W Reclaiming Data Storage Capacity in Flash Memories
CN101464900A (zh) * 2009-01-15 2009-06-24 上海交通大学 Ntfs文件系统下轻量级文件隐藏方法
CN102289451A (zh) * 2011-06-17 2011-12-21 奇智软件(北京)有限公司 文件或文件夹查找方法和装置
CN102298546A (zh) * 2011-09-07 2011-12-28 深圳市万兴软件有限公司 从磁盘上恢复被删除的jpg文件的方法及计算机
CN102609531A (zh) * 2012-02-14 2012-07-25 北京鼎普科技股份有限公司 一种根据关键字反查文件的方法
CN102880713A (zh) * 2012-09-29 2013-01-16 北京奇虎科技有限公司 文件清理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WLZY0938: ""_第二章 FAT文件系统"", 《百度文库》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273523A (zh) * 2017-06-22 2017-10-20 北京北信源软件股份有限公司 一种网络访问记录清除方法及装置
CN107301351A (zh) * 2017-06-22 2017-10-27 北京北信源软件股份有限公司 一种扫描与清除网络访问记录的方法与装置
CN108280192A (zh) * 2018-01-25 2018-07-13 中孚信息股份有限公司 一种根据扇区逆向定位文件的实现方法
CN108491324A (zh) * 2018-03-12 2018-09-04 威创集团股份有限公司 一种软件中的目标词汇搜索方法及装置
CN108491324B (zh) * 2018-03-12 2022-03-22 威创集团股份有限公司 一种软件中的目标词汇搜索方法及装置

Similar Documents

Publication Publication Date Title
JP7507142B2 (ja) データベースにおいてレコードを一括削除するためのシステムおよび方法
US8099401B1 (en) Efficiently indexing and searching similar data
US8495022B1 (en) Systems and methods for synthetic backups
CN109726177A (zh) 一种基于HBase的海量文件分区索引方法
CN110888837B (zh) 对象存储小文件归并方法及装置
CN105474200A (zh) 具有占位符的水合和脱水
JP2005267600A5 (zh)
CN101719141A (zh) 基于目录对象的文件处理方法和系统
US20140358868A1 (en) Life cycle management of metadata
CN104424219A (zh) 一种数据文件的管理方法及装置
CN104699688A (zh) 一种搜索文件的方法和电子设备
CN102609531B (zh) 一种根据关键字反查文件的方法
CN110352410A (zh) 跟踪索引节点的访问模式以及预提取索引节点
EP3343395B1 (en) Data storage method and apparatus for mobile terminal
JP2007287147A (ja) 高速ファイル属性検索
US10311021B1 (en) Systems and methods for indexing backup file metadata
KR20130053152A (ko) 태그 기반 파일 관리 방법 및 그 시스템
CN104778099B (zh) 一种基于历史版本的yaffs2破损文件重构方法
CN107621924A (zh) 一种基于云端清理固态硬盘数据的方法和装置
CN104765656A (zh) 一种冷数据的备份方法及装置
CN103942186A (zh) 一种管理文档的方法及系统
CN102662981A (zh) 基于特征扫描的Windows回收站删除记录取证方法
CN108874820B (zh) 一种系统文件搜索方法
CN114218347A (zh) 多个文件内容的快速索引查找方法
CN102982036B (zh) 一种语料结构化的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150610

点击 这是indexloc提供的php浏览器服务,不要输入任何密码和下载