c++ - 如何找到启动二叉搜索树的好点-6ren

c++ - 如何找到启动二叉搜索树的好点

转载作者：行者123 更新时间：2023-11-28 02:43:59

25

4

我有一个包含大量单词的文本文件，超过 20K，但是它们都是按字母顺序排列的，现在假设你得到一个随机文件，你不知道它有多大，你如何找到一个好的开始点做一棵平衡良好的树？注意:我在 C++ 中执行此操作。谢谢你的任何建议!我目前正在这样阅读它们:

template <typename T>
int BST<T>::loadFromFile(string filename)
{
    int count = 0;
    string tempdata;
    ifstream fin(filename);
    if(!fin)
{
    cout<< "Error: Could no open file\n";
    count--;
}
while(fin)
{
    fin>>tempdata;
    if(fin)
    {
        insertEntry(tempdata);
        cout<<"Word: "<<tempdata<<" Count:"<<count<<endl;
        count++;

    }
}
fin.close();
return count;
}//end of loadFromFile() function

^间距错误，我永远无法将我的代码正确复制到问题中:P

编辑:如果我的插入方法单词正确，我相信在它读取按字母顺序排序的文件后它应该是这样的\行，因为每个单词都比下一个大。

最佳答案

all how would you find a good starting point to make a well balanced tree?

将文件读入元素 vector v

排序 vector v;

a) 从中间加载单个树元素 = (size/2)

b) 从左半部分递归加载 (v[0] .. v[middle]-1),

c) 从右半部分递归加载 (v[middle + 1] .. v[size()]

删除 vector

2014-08-02 更新。

我想我会提供一些关于将排序后的 vector 内容以“良好”顺序传输到二叉树的“递归”性质的见解..一个非随机顺序应该使(简单二叉)树在完全的。

最坏的情况下插入可能会让您进行 O(n) 搜索。

平衡(简单)二叉树的复杂度为 O(log n)。

     static void buildTree(std::vector< std::string >& v)
        { 
           // validation code ... 

           // create 1st node of tree 
           treeStart = new(TreeNode);
           assert(treeStart);

           // announce
           std::cout << "buildTree(std::vector& v)\n" << std::endl;

           // recurse through vector, invoking insertR() for each element
           buildTreeR(v,
                      0,             // smallest index
                      (v.size()-1)); // biggest index

        }


     // recurse through the vector to determine which element to insert
     static void buildTreeR(std::vector< std::string >& v,
                            size_t si,  size_t bi) // small indx, big indx
        {
           // validation code
           do
           {
              size_t di = bi - si;  // delta index 

              switch (di)
              {

              case 0: // 1 elment
              {
                 treeStart->insertR(v[si]);
              }
              break; 

              case 1: // 2 consecutive elements - i.e. 7-6 = 1,  6 7
              {
                 treeStart->insertR(v[si]);  // left
                 treeStart->insertR(v[bi]);  // right
              }
              break;

              case 2: // 3 consecutive elements - i.e. 3-1 = 2,  1 2 3 
              {
                 size_t m = si + 1;
                 treeStart->insertR(v[m]);   // insert middle

                 treeStart->insertR(v[si]);  // insert left 

                 treeStart->insertR(v[bi]);  // insert right 
              }
              break;               

              default: // 4 or more elements - i.e. 32767-0 = 32767, 
              {
                 size_t delta = (bi - si) / 2;

                 size_t m = si + delta;  // the middle of this range

                 treeStart->insertR(v[m]); // insert middle element 

                 buildTreeR (v, si, m-1);  // recurse on left  
                                           // smallest index thru (middle-1)

                 buildTreeR (v, m+1, bi);  // recurse on right 
                                           // (middle+1) thru biggest index
              }
              break;

              }// switch   

           }while(0);

        } // void buildR(std::vector< std::string >& v, size_t si, size_t bi)

仅供引用 - 在我 7 岁的戴尔电脑上，g++ v4.8.1，ubuntu 12.04，

32,767 个项目和 152,729 字节(每个字符串约 5 个字节)的性能。

  buildTree from vec: 
            duration: 132,013 us
         total bytes: 152,729

此外，此 vector 的类型是使用

调用的

 std::stable_sort(v.begin(), v.end());
 // this resulted in a lexicographic sort, probably what you want



 vector    after sort: 
        sort duration: 25,273 us
          total bytes: 152,729
       sizeof(vector): 12
        vector.size(): 32767

存在更复杂的替代方案 - AVL 树、红黑树等。另一方面，有了这些，您可能可以放弃 vector 和排序。

(使用的性能结果-O0)

关于c++ - 如何找到启动二叉搜索树的好点，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25050390/

25

4

0

文章推荐： javascript - Watir 和 Javascript 按钮

文章推荐： javascript - 带通配符的姓氏正则表达式

文章推荐： javascript - jquery 选择器出现问题

树结构之MongoDb 使用的到底是 B 树，还是 B+ 树？
关于 B 树与 B+ 树，网上有一个比较经典的问题：为什么 MongoDb 使用 B 树，而 MySQL 索引使用 B+ 树? 但实际上 MongoDb 真的用的是 B 树吗?
c# - 持久(基于磁盘)R 树(或 R* 树)
如何将 R* Tree 实现为持久(基于磁盘)树？保存 R* 树索引或保存叶值的文件的体系结构是什么？注意:此外，如何在这种持久性 R* 树中执行插入、更新和删除操作？注意事项二:我已经实现了一个
java - 给定另一个 AST 树，在 Java 中创建一个 AST 树
目前，我正在努力用 Java 表示我用 SML 编写的 AST 树，这样我就可以随时用 Java 遍历它。我想知道是否应该在 Java 中创建一个 Node 类，其中包含我想要表示的数据，以及一个数
c++ - C++ 中任何好的范围查询库(使用 K-D 树、四叉树或 R 树)
我之前用过这个库http://www.cs.umd.edu/~mount/ANN/ .但是，它们不提供范围查询实现。我猜是否有一个 C++ 范围查询实现(圆形或矩形)，用于查询二维数据。谢谢。最佳
为什么MySQL数据库索引选择使用B+树?
在进一步分析为什么MySQL数据库索引选择使用B+树之前，我相信很多小伙伴对数据结构中的树还是有些许模糊的，因此我们由浅入深一步步探讨树的演进过程，在一步步引出B树以及为什么MySQL数据库索引选择
数据结构-树，三探之代码实现
书接上回，今天和大家一起动手来自己实现树。相信通过前面的章节学习，大家已经明白树是什么了，今天我们主要针对二叉树，分别使用顺序存储和链式存储来实现树。 01、数组实现我们在上一节中说过，
数据结构-树，再探
书节上回，我们接着聊二叉树，N叉树，以及树的存储。 01、满二叉树如果一个二叉树，除最后一层节点外，每一层的节点数都达到最大值，即每个节点都有两个子节点，同时所有叶子节点都在最后一层，则这个
数据结构-树，初探
树是一种非线性数据结构，是以分支关系定义的层次结构，因此形态上和自然界中的倒挂的树很像，而数据结构中树根向上树叶向下。什么是树？ 01、定义树是由n（n>=0）个元素节点组成的
操作系统的那棵“树”---06
操作系统的那棵“树” 今天从一颗开始，我们看看如何从小树苗长成一颗苍天大树。运转CPU CPU运转起来很简单，就是不断的从内存取值执行。 CPU没有好好运转 IO是个耗费时间的活，如果CPU在取值
r - 从物种列表制作简单的系统发育树状图(树)
我想为海洋生物学类(class)制作一个简单的系统发育树作为教育示例。我有一个具有分类等级的物种列表: Group <- c("Benthos","Benthos","Benthos","Be
c++ - 树，无法正确删除节点
我从这段代码中删除节点时遇到问题，如果我插入数字 12 并尝试删除它，它不会删除它，我尝试调试，似乎当它尝试删除时，它出错了树的。但是，如果我尝试删除它已经插入主节点的节点，它将删除它，或者我插入数字
haskell - 如何在Haskell中实现B+树？
B+ 树的叶节点链接在一起。将 B+ 树的指针结构视为有向图，它不是循环的。但是忽略指针的方向并将其视为链接在一起的无向叶节点会在图中创建循环。在 Haskell 中，如何将叶子构造为父内部节点的子
GWT 树，开幕事件
我在 GWT 中使用树控件。我有一个自定义小部件，我将其添加为 TreeItem: Tree testTree = new Tree(); testTree.addItem(myWidget); 我想
c - 树/链表结构的遍历
它有点像混合树/链表结构。这是我定义结构的方式 struct node { nodeP sibling; nodeP child; nodeP parent; char
c - 树:使用队列进行层序遍历
我编写了使用队列遍历树的代码，但是下面的出队函数生成错误，head = p->next 是否有问题？我不明白为什么这部分是错误的。 void Levelorder(void) { node *tmp,
javascript - 将平面数组解析为嵌套结构(树)
例如，我想解析以下数组: var array1 = ["a.b.c.d", "a.e.f.g", "a.h", "a.i.j", "a.b.k"] 进入: var json1 = { "nod
java - 树-路径总和
问题 -> 给定一棵二叉树和一个和，确定该树是否具有从根到叶的路径，使得沿路径的所有值相加等于给定的和。我的解决方案 -> public class Solution { public bo
带有列的 Java 树
我有一个创建 java 树的任务，它包含三列:运动名称、运动类别中的运动计数和上次更新。类似的东西显示在下面的图像上: 如您所见，有 4 种运动:水上运动、球类运动、跳伞运动和舞蹈运动。当我展开 sk
mysql - H2数据库中的B+树
我想在 H2 数据库中实现 B+ Tree，但我想知道，B+ Tree 功能在 H2 数据库中可用吗？最佳答案 H2 已经使用了 B+ 树(PageBtree 类)。关于mysql - H2数据库
java - 字符串数组(树)
假设我们有 5 个字符串数组: String[] array1 = {"hello", "i", "cat"}; String[] array2 = {"hello", "i", "am"}; Str

首页

博学

6Ren·AI

商城

c++ - 如何找到启动二叉搜索树的好点