💡 这个项目大概是 1月 19 号时完成的了,但是一直没有时间好好梳理一遍,拖到了年后了。虽然是 Project 0,但是如果对 C++ 的一些新语法不熟悉的话,还是会有点难受的。这里只是简单的记录过程和一些实现时的想法,不会公开所有源码。
Task 1 - Template Trie
这个任务主要实现三个类,TrieNode
,TrieNodeWithValue
和 Trie
。
TrieNode
是节点基类,它的实现就比较简单,只需要按照注释写就行,没有很复杂。这个基类存储了 TireNode
中的key_char
,is_end
和子节点指针children
。并主要维护这三个成员的相关函数。
TrieNodeWithValue
这是继承了TireNode
的模板类,首先它既是TireNode
的子类,所以它的指针可以存储在TireNode
的子节点指针map中,与普通的TireNode
链接在一起。同时它又是一个模板类,模板参数是存储的Value
的类型,因此通过特化TireNodeWithValue
可以将不同类型的值存储在该节点中。
同时代码里还约定了,TireNodeWithValue的is_end
为true
,而不包含值的is_end
为false
,这样在运行期也可以方便的判断是否为EndNode。
Tire 是这个 Task 的主要难点,几乎所有代码量都在这个类中了,它主要包含以下几个接口Insert<T>(key, value)
,Remove(key)
和GetValue<T>(key)
。
首先是Insert<T>(key, value)
,这里需要遍历key
中所有字符,然后逐步沿着树进行查找或者插入操作。这里为了方便实现,所以在查找中进行插入时直接TireNode
插入到树中,没有对最后一个字符进行特殊处理(最后一个字符需要插入的是TireNodeWithValue
),而是在完成遍历后,再将最后一个节点转换为TireNodeWithValue
。这里给出代码实现:
bool Insert ( const std :: string & key , T value ) {
TrieNode * parent = nullptr ;
TrieNode * node = root_ . get ();
for ( char key_char : key ) {
if ( node -> HasChild ( key_char )) {
node = node -> GetChildNode ( key_char )-> get ();
std :: unique_ptr < TrieNode > child = std :: make_unique < TrieNode >( key_char );
auto child_ptr = node -> InsertChildNode ( key_char , std :: move ( child ));
if ( child_ptr == nullptr ) {
// node is the last node of the key
// 1. node is end node, return false
// 2. node is not end node, convert it to end node
auto child_with_value = std :: make_unique < TrieNodeWithValue < T >>( std :: move ( * node ), value );
parent -> RemoveChildNode ( key . back ());
parent -> InsertChildNode ( key . back (), std :: move ( child_with_value ));
然后是Remove(key)
接口,这个接口应该是最复杂的一个接口了。它先需要和Insert
一样进行一次查找操作,不同的是这里需要用栈存储住所有遍历过的节点,然后再尝试移除最后一个节点,如果最后一个节点没有子节点,就直接删除该节点,如果有则需要把该节点转换为TireNode
。最后再从栈中不停pop节点出来,看当前节点是否为 EndNode 或者存在子节点,如果是就直接退出即可,否则就需要删除该节点,并继续从栈中 pop 节点。
bool Remove ( const std :: string & key ) {
std :: stack < TrieNode *> node_stack ;
TrieNode * node = root_ . get ();
for ( char key_char : key ) {
if ( node -> HasChild ( key_char )) {
node = node -> GetChildNode ( key_char )-> get ();
// node is not end node, return false
if ( ! node -> IsEndNode ()) {
auto key_char_iter = key . rbegin ();
TrieNode * parent = node_stack . top ();
if ( node -> HasChildren ()) {
// convert node to non-end node
auto new_node = std :: make_unique < TrieNode >( std :: move ( * node ));
parent -> RemoveChildNode ( * key_char_iter );
parent -> InsertChildNode ( * key_char_iter , std :: move ( new_node ));
parent -> RemoveChildNode ( * key_char_iter );
// Recursively remove nodes that have no children and are not terminal node
while ( ! node_stack . empty ()) {
parent = node_stack . top ();
if ( node -> IsEndNode () || node -> HasChildren ()) {
parent -> RemoveChildNode ( * key_char_iter );
最后是GetValue
这个接口,这个就比较简单了,只需要按key
的字符不断在Tire
中进行查找即可,最好再将TireNode
转换为TireNodeWithValue
再取值即可。这里还学到了一个技巧:dynamic_cast
转换失败时返回的是nullptr
。
T GetValue ( const std :: string & key , bool * success ) {
for ( char key_char : key ) {
if ( node -> HasChild ( key_char )) {
node = node -> GetChildNode ( key_char )-> get ();
if ( ! node -> IsEndNode ()) {
auto node_with_value = dynamic_cast< TrieNodeWithValue < T > *> ( node );
if ( node_with_value == nullptr ) {
auto value = node_with_value -> GetValue ();
Task 2 - Concurrent Tire
让Tire
支持并发,只需要在Tire
三个接口上获取对应的锁并在退出时释放即可,这个只需要注意一下别因为没有释放锁导致死锁的情况即可。
Testing
文档已经写得比较全面了,但是在MacOS
上似乎还有点问题,因为默认安装了 clang@14
,所以得修改一下CMakeLists.txt
:
set (BUSTUB_CLANG_SEARCH_PATH "/usr/local/bin" "/usr/bin" "/usr/local/opt/llvm/bin" "/usr/local/opt/llvm@14/bin"
"/usr/local/Cellar/llvm/12.0.1/bin" "/opt/homebrew/opt/llvm@12/bin/" )