1. <tfoot id='yj8da'></tfoot>
  2. <small id='yj8da'></small><noframes id='yj8da'>

  3. <i id='yj8da'><tr id='yj8da'><dt id='yj8da'><q id='yj8da'><span id='yj8da'><b id='yj8da'><form id='yj8da'><ins id='yj8da'></ins><ul id='yj8da'></ul><sub id='yj8da'></sub></form><legend id='yj8da'></legend><bdo id='yj8da'><pre id='yj8da'><center id='yj8da'></center></pre></bdo></b><th id='yj8da'></th></span></q></dt></tr></i><div id='yj8da'><tfoot id='yj8da'></tfoot><dl id='yj8da'><fieldset id='yj8da'></fieldset></dl></div>

      <legend id='yj8da'><style id='yj8da'><dir id='yj8da'><q id='yj8da'></q></dir></style></legend>
      • <bdo id='yj8da'></bdo><ul id='yj8da'></ul>

    1. 在包含 1 亿个字符串的大型文本文件中进行高效

      时间:2023-09-29

      <small id='8EZop'></small><noframes id='8EZop'>

      • <bdo id='8EZop'></bdo><ul id='8EZop'></ul>
            <tbody id='8EZop'></tbody>

        1. <legend id='8EZop'><style id='8EZop'><dir id='8EZop'><q id='8EZop'></q></dir></style></legend><tfoot id='8EZop'></tfoot>

              • <i id='8EZop'><tr id='8EZop'><dt id='8EZop'><q id='8EZop'><span id='8EZop'><b id='8EZop'><form id='8EZop'><ins id='8EZop'></ins><ul id='8EZop'></ul><sub id='8EZop'></sub></form><legend id='8EZop'></legend><bdo id='8EZop'><pre id='8EZop'><center id='8EZop'></center></pre></bdo></b><th id='8EZop'></th></span></q></dt></tr></i><div id='8EZop'><tfoot id='8EZop'></tfoot><dl id='8EZop'><fieldset id='8EZop'></fieldset></dl></div>
              • 本文介绍了在包含 1 亿个字符串的大型文本文件中进行高效的子字符串搜索(无重复字符串)的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

                问题描述

                我有一个包含 1 亿个字符串(没有重复字符串)的大型文本文件(1.5 Gb),并且所有字符串在文件中逐行排列.我想在java中制作一个wepapplication,以便当用户给出关键字(子字符串)时,他可以获得包含该关键字的文件中存在的所有字符串的计数.我已经知道一种技术 LUCENE..还有其他方法可以做到这一点吗??我希望在 3-4 秒内得到结果.我的系统有 4GB 内存和双核配置....需要在仅限 JAVA"中执行此操作

                I have a large text file(1.5 Gb) having 100 millions Strings(no duplicate String) and all the Strings are arranged line by line in the file . i want to make a wepapplication in java so that when user give a keyword(Substring) he get the count of All the strings present in the file which contains that keyword. i know one technique LUCENE already..is there any other way to do this.?? i want the result within 3-4 seconds. MY SYSTEM HAS 4GB RAM AND DUAL CORE configuration.... need to do this in "JAVA ONLY"

                推荐答案

                由于您的 RAM 大于文件的大小,您也许可以将整个数据作为结构存储在 RAM 中并快速搜索.A trie 可能是一个很好的数据结构;它确实有快速的前缀查找,但不确定它对子字符串的执行情况.

                Since you have more RAM than the size of the file, you might be able to store the entire data as a structure in the RAM and search it very quickly. A trie might be a good data structure to use; it does have fast prefix finding, but not sure how it performs for substrings.

                这篇关于在包含 1 亿个字符串的大型文本文件中进行高效的子字符串搜索(无重复字符串)的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持html5模板网!

                上一篇:如何对用 lucene 索引的文档进行分类 下一篇:如何获取 Lucene 模糊搜索结果的匹配项?

                相关文章

                最新文章

              • <i id='uEa6P'><tr id='uEa6P'><dt id='uEa6P'><q id='uEa6P'><span id='uEa6P'><b id='uEa6P'><form id='uEa6P'><ins id='uEa6P'></ins><ul id='uEa6P'></ul><sub id='uEa6P'></sub></form><legend id='uEa6P'></legend><bdo id='uEa6P'><pre id='uEa6P'><center id='uEa6P'></center></pre></bdo></b><th id='uEa6P'></th></span></q></dt></tr></i><div id='uEa6P'><tfoot id='uEa6P'></tfoot><dl id='uEa6P'><fieldset id='uEa6P'></fieldset></dl></div>

                <small id='uEa6P'></small><noframes id='uEa6P'>

                <tfoot id='uEa6P'></tfoot>

                  1. <legend id='uEa6P'><style id='uEa6P'><dir id='uEa6P'><q id='uEa6P'></q></dir></style></legend>
                      <bdo id='uEa6P'></bdo><ul id='uEa6P'></ul>