gpt4 book ai didi

java - Java中搜索和连接功能的使用

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:26:05 24 4
gpt4 key购买 nike

编辑:我听取了您的想法并决定在执行搜索时使用 HashMaps 而不是 ArrayLists,后者被证明要快得多。不幸的是,我在实现 Join 函数时遇到了困难,因为它不会连接来自两个不同文本文件的数据。相反,它只输出我要查找的数据的索引号。谁能告诉我我做错了什么?

我有几个文本文件,其中包含大约 200,000 个数据条目。

文件如下:- artists.txt(包含歌曲 ID 和艺术家姓名)- albums.txt(包含歌曲 ID、歌曲名称、制作年份、艺术家 ID、制作人 ID、费用)- production.txt(包含歌曲 ID、艺术家 ID、涉及的艺术家数量)- studio.txt(包含工作室位置和制作人 ID)

我需要实现一种算法,该算法将扫描文档以在最短的时间内找到指定的数据。

我给你举个例子:我想找到艺术家的名字(来自 artists.txt),他在特定年份创作了标题为(来自 albums.txt)的歌曲。我还想连接这两个表,因此输出将显示两个文件中的选定数据。

当前的实现需要很长时间才能找到指定的条目(40 秒才能显示所有以 A 开头的艺术家姓名),因为它会扫描整个文档。有人告诉我,我的代码应该能够在几分之一秒内解决这个问题。我正在考虑添加 HashMaps/TreeMaps 而不是 ArrayList,但我不确定这是否会改变任何东西。

您能否推荐一种更好的实现方法?我想知道我应该使用什么数据类型以及处理这个问题最快最合适的算法是什么。

我需要说我是 JAVA 的新手,因此我对这个主题了解不多,但我很想尝试您的建议。

我不是在寻找现成的解决方案,我只是想知道您对此主题的看法,并希望获得一些关于如何获得预期效果的提示。

编辑后的代码:

import java.io.BufferedReader;
import java.io.FileReader;
import java.util.ArrayList;
import java.util.Comparator;
import java.util.HashMap;
import java.util.LinkedHashMap;

public class Table {
String line;
int columns;
HashMap<String,ArrayList<String>> grid;

public Table(int columns)
{
grid = new HashMap<String,ArrayList<String>>();
this.columns = columns;
}

public Table(int columns, String filename) throws Exception
{
grid = new HashMap<String,ArrayList<String>>();
this.columns = columns;

BufferedReader fh =
new BufferedReader(new FileReader(filename));


int lineNum = 0;

//Add all the lines from text file
while(null != (line=fh.readLine()))
{
String[] parts = line.split("\t");
//Separate the text file into parts
String name = parts[0];
String id = parts[1];
//Create new ids
if(!grid.containsKey(id))
grid.put(id,new ArrayList<String>());

//Add a name to each id
grid.get(id).add(name);
}
}

public class comp implements Comparator<ArrayList<String>> {
int whichCol;

public int compare(ArrayList<String> o1, ArrayList<String> o2) {
return o1.get(whichCol).compareTo(o2.get(whichCol));
}
}

public Table SelectAll(int colNum, String val)
{
Table result = new Table(this.columns);
for(ArrayList<String> row:this.grid.values())
{
if (row.size()<=colNum)
System.out.println("Error: "+row.toString());
if (!row.get(colNum).startsWith(val))
{
result.grid.put(row.get(colNum), row);
System.out.println(row);
}
}
return result;
}

public Table Join(int col1, Table r, int col2)
{
Table result = new Table(this.columns+r.columns);
HashMap<String,ArrayList<String>> sorrid = (HashMap<String,ArrayList<String>>) this.grid.clone();
comp mycomp = new comp();
mycomp.whichCol = col1;

//For everyone in the first one, check everyone in second one
for(ArrayList<String> i: this.grid.values())
{
for(ArrayList<String> j: r.grid.values())
{
if(i.get(col1).equals(j.get(col2)))
{
ArrayList<String> newrow = new ArrayList<String>();
newrow.addAll(i);
newrow.addAll(j);
result.grid.put(newrow.get(0), newrow);
}
}
}
return result;
}

public void displayAll()
{
for(String r : grid.keySet())
{
System.out.println(r);
for(String n : grid.get(r))
System.out.println(" " + n);
}
}

public void displaySelected(String value)
{
for(String r : grid.keySet())
{
if(r.startsWith(value))
System.out.println(r);
}
}

public Table SelectEq(int colNum, String val)
{
Table result = new Table(this.columns);
for(ArrayList<String> row:this.grid.values())
{
if (row.size()<=colNum)
System.out.println("Error: "+row.toString());
if (row.get(colNum).equals(val))
result.grid.put(row.get(0), row);
}
return result;
}

public int size()
{
return this.grid.size();
}

public Table StartsWith(int colNum, String val)
{
Table result = new Table(this.columns);
for(String r : grid.keySet())
{
if (grid.size()<=colNum)
System.out.println("Error: "+r.toString());
if (r.startsWith(val))
result.grid.put(r, new ArrayList<String>());
}
return result;
}
}

最佳答案

这是我的方法/设计:

  • 创建类艺术家{歌曲,艺术家}
  • 创建类专辑{歌曲、标题、年份、艺术家、制作人、成本}
  • 创建类制作{歌曲、艺术家、艺术家数量}
  • 创建工作室{位置,制作人}

加载器实例化这些类并将对象引用添加到多个 NavigableMaps 中.

例如:查看专辑中的艺术家姓名,由年份和歌曲名称指定:

NavigableMap<Integer,Album> matchYear = albumsByYear.subMap( 2004, true, 2005, false );
NavigableMap<String,Album> matchTitle = albumsBySongTitle.tailMap( title );
Set<Album> matchYearAndTitle = year2004.values().retainAll( titled.values());
for( Album a : matchYearAndTitle )
{
System.out.println( a.getArtist());
}

等等……

您必须定义所有 map ,一个按索引列。

关于java - Java中搜索和连接功能的使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12923131/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com