基于上一章的内容,我们需要把key替换成hash值存储到b+tree中
首先要改变的就是set和get函数
template<typename T> int smallsql::getType() { return typeid(T) == typeid(int) ? 0 : 1; } template<typename T> void smallsql::set(const std::string& key,const T& value) { unsigned long iKey = HashString(key,1); int type = getType<T>(); sqlData<T>* pItem = static_cast<sqlData<T>*>(bplus_tree_get(m_pTree,iKey,type)); if (pItem == nullptr) { bplus_tree_put(m_pTree,nullptr,type); pItem = new sqlData<T>(); pItem->value = value; bplus_tree_put(m_pTree,pItem,type); } else { pItem->value = value; } } template<typename T> T smallsql::get(const std::string& key) { unsigned long iKey = HashString(key,type)); if (pItem == nullptr) { return T(); } else { return pItem->value; } }
这两个函数首先都需要用HashString函数把key的内容转换成unsigned long类型的整数
然后存储到bplus_tree中,这些都在上一章里介绍过,需要需要看具体的实现附件有工程文件可以看
然后就是open和close函数,他们负责读取和保存,也需要修改
bool smallsql::open(const std::string& sqlPath) { FILE* fp = nullptr; m_sqlPath = sqlPath; fopen_s(&fp,sqlPath.c_str(),"r"); if (fp == nullptr) { return true; } while (!feof(fp)) { unsigned long key = 0; fread_s(&key,sizeof(unsigned long),1,fp); if (key == 0) { continue; } int type = 0; fread_s(&type,fp); if (type == 0) { int value = 0; fread_s(&value,sizeof(int),fp); sqlData<int>* pItem = new sqlData<int>(); pItem->value = value; bplus_tree_put(m_pTree,key,type); } else if (type == 1) { int len = 0; fread_s(&len,fp); char* value = new char[len + 1]; fread_s(value,len,fp); value[len] = 0; sqlData<std::string>* pItem = new sqlData<std::string>(); pItem->value = std::string(value); delete[] value; bplus_tree_put(m_pTree,type); } } fclose(fp); return true; } void smallsql::close() { FILE* fp = nullptr; fopen_s(&fp,m_sqlPath.c_str(),"w"); if (fp == nullptr) { return; } struct bplus_leaf *leaf = (struct bplus_leaf *)m_pTree->head[0]; if (leaf != NULL) { while (leaf != NULL) { for (int j = 0; j < leaf->entries; ++j) { fwrite(&leaf->key[j],fp); fwrite(&leaf->datatype[j],fp); if (leaf->datatype[j] == 0) // int { sqlData<int>* pItem = static_cast<sqlData<int>*>(leaf->data[j]); fwrite(&pItem->value,fp); } else if (leaf->datatype[j] == 1) // string { sqlData<std::string>* pItem = static_cast<sqlData<std::string>*>(leaf->data[j]); int len = pItem->value.length(); fwrite(&len,fp); fwrite(pItem->value.c_str(),fp); } } leaf = leaf->next; } } fclose(fp);
相对于上一个版本,稍微简单了点
另外b+tree的代码也需要修改(相对于上一章给出的b+tree实现版本https://github.com/begeekmyfriend/bplustree)
需要加入int datatype[MAX_ENTRIES];表示数据类型,另外key的类型从int->unsigned long,相应的函数也需要修改一下
总体来说大概就是加入b+tree和hash算法的实现代码bplustee.h/cpp和hash.h/cpp,另外小小的修改一下set和get函数,open和close函数
替换完成,赶紧看看1W个数据的测试时间,可以看出最慢的插入只需要0.07秒,而上一个版本需要7.6秒 快了100倍
这下我们可以试试10W数据了,10W数据只需要0.57秒,而上一个版本需要80秒,快了140倍
再来试试100W数据测试,最慢需要4.1秒
到这里,数据库基本能看了,至少效率比之前好多了接下来还有不少需要优化的地方