Category: Computer Science

  • CMake剖析

    工作机制

    module

    封装一系列可复用的功能,方便使用,分为内置Module与自定义Module

    Cache

    target

    构建的产物,比如executablelibrary

    常用Module、命令

    include

    从一个文件或者Module加载CMake代码

    CMakeDependentOption

    cmake_dependent_option

    定义条件选项,在一定条件成立时才生效

  • 【BTC源码系列】随机漫步Day1

    程序入口

    比特币源码是用C++写的,构建系统用的CMake,在CMakeLists.txt中可以找到add_executable命令,含义是最终构建的二进制产物,此命令的参数中会指定源文件。

    重要设计

    主流程

    • 创建全局上下文
    • 连接服务端信号处理函数
    • 解析命令行参数
    • 启动程序

    数据结构

    疑问

    • noui_connect貌似是注册UI事件的,但是名字又叫noui

    欠缺的知识

    • C++命名空间的规则
      • 实际的大型项目中常用的idiom,即编程惯用法

    参考资料

    • 比特币node启动的命令行参数
  • 【BTC源码系列】开篇词

    进入加密货币行业4个月了,懵懵懂懂做了一些公司业务的需求,学了一些加密货币行业的皮毛知识,每天挂在嘴边的尽是些上链、签名、EVM、手续费等似是而非的名词。另一方面,Web3给我的体感是还在不断涌现新的项目,每次点开项目官网都有一种眩晕感,一开始还觉得这个项目又引领了一个创新,解决了Web3的重大难题,但是慢慢地,新鲜感一过,感受到的只有麻木,而且那么多币经我的手上链,感觉自己的提升并没有多少,只是对公司内部的技术栈以及工作流程更熟悉了而已。

    静下心来想了一段时间,加密货币毕竟在国内游走在灰色地带,生态没有起来,中文社区的技术沉淀不够,对于新人入门很不友好。英文资料浩如烟海,虽然英语阅读对于我来说不是不可逾越的门槛,但是却也实打实地影响我的学习效率,一开始也想沉下心来慢慢学,但是时间被业务裹挟,始终没有开始做。终于,这段时间感觉学有余力了,狠狠心踏上BTC源码的学习之路。

    值得投入时间吗

    直接说答案吧,值得!从大的方面讲,有以下两点:

    • 加密货币行业依然处在扩张期。以2024年末尾比特币价格首次突破10万美元为标志,比特币不可避免会在人们心中种下一颗种子,一颗将成长为比肩甚至超越黄金的种子,比特币还远远没有结束。现在投入时间肯定是最优选择。
    • 希望我能获得一张进入开源世界的钥匙。这个角度是从我的个人发展角度论述的,三年,我的三年程序员生涯只是让我获得一些打工的技能,而且这个技能还不算特别突出。学生时代见证了诸多互联网大佬的崛起,从财务自由走向财务自由,却并没有激发我的欲望,可能是前面20年走的太顺了吧,一副无所欲无所求的样子,这个其实不对的。我的状态应该切换过来,趁着现在还有接受新事物的能力,去疯狂尝试,疯狂试错,找到自己真正感兴趣与擅长的。如果可以做到,我希望是从这个事情开始。

    要做成什么样

    一次做到完美不可能,粗略想了一下,分以下几步走:

    • 对整个项目有框架性的了解,包括项目设计、技术栈,尤其是结合比特币概念展开,具体的实现细节不需要很清楚,做到有问题能知道去哪里找就行了
    • 回馈开源社区。到github上找几个没有解决的issue,尝试解决,走一遍完整的issue修复的交付流程
    • 深入代码的实现细节,了解现有实现的局限,能跟得上社区大佬的前沿讨论,做一个专家
    • 钻研区块链的分布式算法,主要是代码

    路径与方法

    • 早睡早起
    • 前期速度可以慢,静下心来把C++、CMake搞清楚
    • 公司报销了Cursor的订阅费,后期尝试利用AI加快阅读源码速度
  • C++宏特性

    背景

    宏(Macro)是C++里的一个让人又爱又恨的特性,非常难以掌握。然而,悲剧的是,许多大型C++项目中宏的使用满天飞,因此宏是一个C++程序员难以摆脱的特性,我们有必要梳理一下宏的用法。

    特性

    #(井号/Hash Symbol)

    • 单独一个#放在宏定义参数的前面时,语义为将宏定义的参数转换为字符串常量
    • 连续两个#放在两个宏定义参数的中间时,语义是将两个宏定义参数拼接为一个符号。
  • Python类型系统

    分类

    Structural typesNominal types
    Runtime checkingDuck typingGoose typing
    Static checkingStatic duck typingStatic typing
    表1 Python类型系统分类——动态/静态类型检查、显式/隐式声明类间的继承/实现关系

    两种结构化类型的形式

    本小节讨论表1第一列中的两种类型系统。

    首先解释清楚一个概念,协议或者protocol,在Python中,这个概念可以理解为一个方法集合,其中的每个方法都有约定好的签名和语义,但在不同的类型系统下,对于用户自定义类的实现要求是不一样的。

    对于Python原生支持的duck typing,程序员可以不必实现协议中的每一个方法,但是只在PEP 544被采纳之后才支持的static duck typing,严格要求实现协议中的每一个方法。在Python社区中,前者称之为动态协议,后者称之为静态协议,如果未明确指明的话,一般指动态协议。

    两种形式的共同点是都无需显式声明所实现的协议,会有相对应的方法检查类的方法集合。

    Duck typing编程

    防御式&Fail Fast

    防御式编程的目的是增强程序的安全性,而Fail fast一方面通过尽早抛出异常来避免不可预料的后果,另一方面也便于定位问题,提高升序的可维护性。

    那么我们如何发现异常呢?是不是需要程序员一条条编写检查代码呢?答案是否定的,而且用一句话就能解释,EAFP,懂的都懂,不懂的看下面。

    EAFP

    It’s easier to ask for forgiveness than permission

    EAFP带给Python一种很不一样的特质:把思考聚焦在程序的正常执行流上,进而保持思维流的连贯。当然这也得益于Python语言精心设计的Exception类层级。

    Goose Typing

    Python中没有直接定义Interface这个概念,但是ABC(Abstract Base Class)充当了这一功能,使得程序员可以对现实世界的东西建模,定义语法和语义都严谨的一组方法,然后配合Python自带的isinstanceisubclass函数,可以在运行时灵活地对对象进行自省。

    Goose Typing算是对Duck Typing的一种补充,允许适当且适量地使用isinstance,并且第二个参数必须是ABC而不是具体类型。

    多继承

    菱形继承

    在一个菱形的继承关系中,有可能出现命名冲突的问题——互为兄弟节点的两个类各自有自己的方法实现。当出现这种情况时,每种语言都要有一套决议(Resolution)方案,Python的方案为mro,即Method Resolution Order。

    mro存储在类的一个名为__mro__的属性中,是一个元组。

    super函数

    super这个名字可能有些误导,会让人以为会返回当前类的父类。首先先摒弃掉这种望文生义的想法。其次,super的工作机制与mro紧密联系,具体来说,mro决定了在一个多继承关系中类的方法激活顺序,而是否被激活取决于方法的实现是否调用了super。如果调用了super,那么调用链将沿着mro继续;如果没有,调用链就结束。因此,super函数是协作式的。

  • Python常用特性

    字符串格式化

    Python中的f字符串、format()内置函数、str.format()方法中都接受format_spec作为参数。

    f字符串中包含一种特殊的以开闭花括号(‘{‘, ‘}‘)为界的replacement field,形如{field_name:format_spec}

    在format_spec中使用的记号称之为Format Specification Mini-Language。

    用户自定义类可以实现__format__方法来自定义自己的Format Specification Mini-Language,object类中的默认实现是返回str(my_object)

    可哈希类(Hashable Type)

    从语法上讲,在类的定义中必须实现以下2个方法:

    • __eq__(self, other: object)
    • __hash__(self)

    从语义上讲,类的定义必须满足以下条件:

    • 类的实例在进行相等性比较的时候,相等的实例必须拥有相等的哈希值
    • 类的实例不可变

    序列类(Sequence Type)

    切片(Slicing)

    用户自定义类支持切片的必要条件是实现__getitem__魔法方法,语义上也要满足。当执行切片时,__getitem__的入参类型为slice,且它是Python的内置类型。

    slice类型除了大家熟知的startstopstride外,还有一个鲜为人知的方法,indices,官方文档说明如下:

    S.indices(len) -> (start, stop, stride)

    Assuming a sequence of length len, calculate the start and stop
    indices, and the stride length of the extended slice described by
    S. Out of bounds indices are clipped in a manner consistent with the
    handling of normal slices.

    说白了,某个slice中的三个关键属性:startstopstride,有可能缺省,有可能为负数,indices的作用就是根据序列的长度len,把它们补齐,或者重新计算,使得其“完美”适配长度为len的序列,比如原本stop属性的值大于len,那么新的stop会等于len,这个过程称之为归一化(Normalize)。

    私有以及”保护”属性

    • 以双下划线(__)开头的属性称为私有属性,解释器会对其做”name mangle”,具体做法是在原有名字的基础上拼接单下划线类名的前缀,程序员可以通过__dict__属性查看。
    • 以单下划线(_)开头的属性称为“保护”属性,之所以要加引号是因为对于解释器来说,所谓的“保护”属性并没有什么不同,仅仅是程序员之间形成的一个约定而已
  • C++常用数据结构

    pair

    Qualified NameIncludeReference
    std::pair<utility>pair-cppreference
    pair简要信息

    常用变量

    NameTypeSynopsis
    firstT1pair的第一个成员变量
    secondT2pair的第二个成员变量
    pair常用的成员变量

    常用函数

    SignatureSynopsisNotes
    pair<T1, T2> make_pair(const T1& t, const T2& u);
    pair<T1, T2> make_pair(T1&& t, T2&& u);
    用于构造的工具函数
    pair常用的非成员函数

    STL容器

    SignatureSynopsisNotes
    iterator find(const Key& key);
    const_iterator find(const Key& key);
    检索与key相等的元素Lookup
    通用成员函数

    双端队列

    Qualified NameIncludeReference
    std::deque<deque>deque-cppreference
    deque简要信息

    常用函数

    SignatureSynopsisNotes
    reference front();
    const_reference front() const;
    获取队首元素
    reference back();
    const_reference back() const;
    获取队尾元素
    deque常用的Access成员函数
    SignatureSynopsisNotes
    void push_front(const T& value);
    void push_front(T&& value);
    向队首压入元素
    void emplace_front(Args&&... args);向队首压入元素,与push_front所不同的是,直接在队列的内部地址上初始化数据,而无需经过一次拷贝或移动
    void push_back(const T& value);
    void push_back(T&& value);
    向队尾压入元素
    void emplace_back(Args&&... args);向队尾压入元素,与push_back不同的是,直接在队列的内部地址上初始化数据,而无需经过一次拷贝或者移动
    void pop_front();从队首弹出元素
    void pop_back();从队尾弹出元素
    deque常用的Modifier成员函数

    集合

    Qualified NameIncludeReference
    std::unordered_set<unordered_set>unordered_set-cppreference
    std::set
    集合简要信息

    常用函数

    SignatureSynopsisNotes
    std::pair<iterator, bool> insert(const value_type& value);
    std::pair<iterator, bool> insert(value_type&& value);
    插入元素
    常用的成员函数

    优先队列

    Qualified NameIncludeReference
    std::priority_queue<queue>priority_queue-cppreference
    优先队列简要信息

    常用函数

    SignatureSynopsisNotes
    const_reference top() const;
    void push(const value_type& value);
    void push(value_type&& value);
    void pop();