Go2 设计草案介绍

2018-08-29 20:19:39 +08:00
 songtianyi

写下自己的理解。大家都在吐槽泛型,我觉得还行吧,contract 的表达能力蛮强的。

原文链接 https://github.com/songtianyi/songtianyi.github.io/blob/master/mds/techniques/go2-design-draft-introduction.md

go2 设计草案介绍

作者: songtianyi 2018-08-29

前言

Go,毫无疑问已经成为主流服务端开发语言之一,但它的类型特性却少的可怜,仅支持structural subtyping。在 TIOBE 排名前二十的语言中,不管是上古语言 Java, 还是 2010 年之后出现的新语言 Rust/Julia 等,都支持至少三种类型特性,对此社区抱怨很多,另外还有它的错误处理方式,以及在 Go1.11 版本才解决的依赖管理等问题。在最近的 GopherCon2018 上,官方放出了解决这些问题的草案(draft),这些内容还没有成为正式的提案(proposal), 只是先发出来供大家讨论,最终会形成正式提案并被逐步引入到后续的版本中。此次放出的草案,集中讨论了三个问题,泛型 /错误处理 /错误值。

泛型

泛型是复用逻辑的一个有效手段,在 2016 和 2017 年的 Go 语言调查中,泛型都列在最迫切的需求之首,在 Go1.0 release 之后 Go team 就已经开始探索如何引入泛型,但同时要保持 Go 的简洁性(开发者喜爱 Go 的主要原因之一),之前的几种实现方式都存在严重的问题,被废弃掉了,所以进展并不算快,甚至导致部分人误解为 Go team 并不打算引入泛型。现在,最新的草案经过半年的讨论和优化,已经确认可行(could work),我们期待已久的泛型几乎是板上钉钉的事情了,那么 Go 的泛型大概长什么样?

在没有泛型的情况下,通过interface{}是可以解决部分问题的,比如ring的实现,但这种方法只适合用在数据容器里, 且需要做类型转换。当我们需要实现一个通用的函数时,就做不到了,例如实现一个函数,其返回传入的 map 的 key:

package main

import "fmt"

func Keys(m map[interface{}]interface{}) []interface{} {
	keys := make([]interface{}, 0)
	for k, _ := range m {
		keys = append(keys, k)
	}
	return keys
}

func main() {
	m := make(map[string]string, 1)
	m["demo"] = "data"
	fmt.Println(Keys(m))
}

这样写连编译都通过不了,因为类型不匹配。那么参考其他支持泛型的语言的语法,可以这样写:

package main

import "fmt"

func Keys<K, V>(m map[K]V) []K {
	keys := make([]K, 0)
	for k, _ := range m {
		keys = append(keys, k)
	}
	return keys
}

func main() {
	m := make(map[string]string, 1)
	m["demo"] = "data"
	fmt.Println(Keys(m))
}

但是这种写法是有缺陷的,假设 append 函数并不支持 string 类型,就可能会出现编译错误。我们可以看下其他语言的做法:

// rust
fn print_g<T: Graph>(g : T) {
    println!("graph area {}", g.area());
}

Rust 在声明 T 的时候,限定了入参的类型,即入参 g 必须是 Graph 的子类。和Rust的 nominal subtyping 不同,Go 属于 structural subtyping,没有显式的类型关系声明,因此不能使用此种方式。Go 在草案中引入了contract来解决这个问题,语法类似于函数, 写法更复杂,但表达能力比 Rust 要更强:

// comparable contract
contract Equal(t T) {
	t == t
}
// addable contract
contract Addable(t T) {
	t + t
}

上述代码分别约束了 T 必须是可比较的(comparable),必须是能做加法运算(addable)的。使用方式很简单, 定义函数的时候加上约束即可:

func Sum(type T Addable(T))(x []T) T {
	var total T
	for _, v := range x {
		total += v
	}
	return total
}

var x []int
total := Sum(int)(x)

得益于类型推断,在调用 Sum 时可以简写成:

total := Sum(x)

contract 在使用时,如果参数是一一对应的(可推断), 也可以省略参数:

func Sum(type T Addable)(x []T) T {
	var total T
	for _, v := range x {
		total += v
	}
	return total
}

不可推断时就需要指明该 contract 是用来约束谁的:

func Keys(type K, V Equal(K))(m map[K]V) []K {
	...
}

当然,下面的写法也可以推断,最终如何就看 Go team 的抉择了:

func Keys(type K Equal, V)(m map[K]V) []K {
	...
}

关于实现方面的内容,这里不再讨论,留给高手吧。官方开通了反馈渠道,可以去提意见,对于我来说,唯一不满意的地方是显式的type关键字, 可能是为了方便和后边的函数参数相区分吧。

错误处理

健壮的程序需要大量的错误处理逻辑,在极端情况下,错误处理逻辑甚至比业务逻辑还要多,那么更简洁有效的错误处理语法是我们所追求的。

先看下目前 Go 的错误处理方式,一个拷贝文件的例子:

func CopyFile(src, dst string) error {
	r, err := os.Open(src)
	if err != nil {
		return fmt.Errorf("copy %s %s: %v", src, dst, err)
	}
	defer r.Close()

	w, err := os.Create(dst)
	if err != nil {
		return fmt.Errorf("copy %s %s: %v", src, dst, err)
	}

	if _, err := io.Copy(w, r); err != nil {
		w.Close()
		os.Remove(dst)
		return fmt.Errorf("copy %s %s: %v", src, dst, err)
	}

	if err := w.Close(); err != nil {
		os.Remove(dst)
		return fmt.Errorf("copy %s %s: %v", src, dst, err)
	}
}

上述代码中,错误处理的代码占了总代码量的接近 50%!

Go 的assignment-and-if-statement错误处理语句是罪魁祸首,草案引入了check表达式来代替:

r := check os.Open(src)

但这只代替了赋值表达式和 if 语句,从之前的例子中我们可以看到,有四行完全相同的代码:

return fmt.Errorf("copy %s %s: %v", src, dst, err)

它是可以被统一处理的, 于是 Go 在引入check的同时引入了handle语句:

handle err {
		return fmt.Errorf("copy %s %s: %v", src, dst, err)
}

修改后的代码为:

func CopyFile(src, dst string) error {
	handle err {
		return fmt.Errorf("copy %s %s: %v", src, dst, err)
	}

	r := check os.Open(src)
	defer r.Close()

	w := check os.Create(dst)
	handle err {
		w.Close()
		os.Remove(dst) // (only if a check fails)
	}

	check io.Copy(w, r)
	check w.Close()
	return nil
}

check 失败后,先被执行最里层的(inner most)的 handler,接着被上一个(按照语法顺序)handler 处理,直到 handler 执行了return语句。

Go team 对该草案的期望是能够减少错误处理的代码量, 且兼容之前的错误处理方式, 要求不算高,这个设计也算能接受吧。

反馈渠道

错误值

Go 的错误值目前存在两个问题。一,错误链(栈)没有被很好地表达;二,缺少更丰富的错误输出方式。在该草案之前,已经有不少第三方的 package 实现了这些功能,现在要进行标准化。目前,对于多调用层级的错误,我们使用 fmt.Errorf 或者自定义的 Error 来包裹它:

package main

import (
	"fmt"
	"io"
)

type RpcError struct {
	Line uint
}

func (s *RpcError) Error() string {
	return fmt.Sprintf("(%d): no route to the remote address", s.Line)
}

func fn3() error {
	return io.EOF
}

func fn2() error {
	if err := fn3(); err != nil {
		return &RpcError{Line: 12}
	}
	return nil
}
func fn1() error {
	if err := fn2(); err != nil {
		return fmt.Errorf("call fn2 failed, %s", err)
	}
	return nil
}
func main() {
	if err := fn1(); err != nil {
		fmt.Println(err)
	}
}

此程序的输出为:

call fn2 failed, (12): no route to the remote address

很明显的问题是,我们在 main 函数里对 error 进行处理的时候不能进行类型判断, 比如使用 if 语句判断:

if err == io.EOF { ... }

或者进行类型断言:

if pe, ok := err.(*os.PathError); ok { ... pe.Path ... }

它是一个 RpcError 还是 io.EOF? 无从知晓。一大串的错误信息,人类可以很好地理解,但对于程序代码来说就很困难。

error inspection

草案引入了一个 error wrapper 来包裹错误链, 它相当于一个指针,将错误栈链接起来:

package errors

// A Wrapper is an error implementation
// wrapping context around another error.
type Wrapper interface {
	// Unwrap returns the next error in the error chain.
	// If there is no next error, Unwrap returns nil.
	Unwrap() error
}

每个层级的 error 都实现这个 wrapper,这样在 main 函数里,我们可以通过 err.Unwrap() 来获取下一个层级的 error。另外,草案引入了两个函数来简化这个过程:

// Is reports whether err or any of the errors in its chain is equal to target.
func Is(err, target error) bool

// As checks whether err or any of the errors in its chain is a value of type E.
// If so, it returns the discovered value of type E, with ok set to true.
// If not, it returns the zero value of type E, with ok set to false.
func As(type E)(err error) (e E, ok bool)
error formatting

有时候我们需要将错误信息分类,因为某些情况下你需要所有的信息,某些情况下只需要部分信息,因此草案引入了一个 interface:

package errors

type Formatter interface {
	Format(p Printer) (next error)
}

error 类型可以实现 Format 函数来打印更详细的信息:

func (e *WriteError) Format(p errors.Printer) (next error) {
	p.Printf("write %s database", e.Database)
	if p.Detail() {
		p.Printf("more detail here")
	}
	return e.Err
}

func (e *WriteError) Error() string { return fmt.Sprint(e) }

在你使用fmt.Println("%+v", err)打印错误信息时,它会调用 Format 函数。

反馈渠道

7530 次点击
所在节点    程序员
73 条回复
kernel
2018-08-29 21:51:58 +08:00
我大 JS 2 空格党表示缩进 4 个已经不爽了 go 缩 8 个。。。
loqixh
2018-08-29 22:35:12 +08:00
Go,毫无疑问已经成为主流服务端开发语言之一 谁给的自信............
songtianyi
2018-08-29 22:56:30 +08:00
@loqixh 现在 Go 职位蛮多的,这么说没毛病吧。
songtianyi
2018-08-29 22:57:14 +08:00
@kernel 1 个 tab, 看平台怎么渲染的了。
wenzhoou
2018-08-29 23:04:24 +08:00
主流是形容服务端的。再说了,还有之一嘛!
Kilerd
2018-08-29 23:22:43 +08:00
唯一一个用 tab 做缩进的语言,而且还是规范中强制。

难受
mrcode
2018-08-29 23:24:21 +08:00
@loqixh 认同楼上,谁给的自信让你加上“之一“的,分明是:毫无疑问已经成为主流服务端开发语言
glues
2018-08-29 23:39:50 +08:00
这错误处理,还不如 go 1.x,虽然 1.x 已经够恶心的了
kidlj
2018-08-29 23:59:26 +08:00
写得很好,清晰明了。感谢。
blless
2018-08-30 01:22:57 +08:00
@loqixh 看讨论就知道 明显现在很多了,我司用 go 重构了几个 python 小服务之后就开始爆发了
kran
2018-08-30 01:35:45 +08:00
一对比 1 的错误处理没那么差嘛😄
感谢楼主,写的好
loqixh
2018-08-30 08:39:06 +08:00
@blless 来来来, 说说市场占有率, 配得上主流二字, 少说也得 1%? 现在有 0.1%不?
BBCCBB
2018-08-30 08:39:38 +08:00
有理有据,令人信服
artandlol
2018-08-30 09:09:27 +08:00
@loqixh docker 容器的 都是 golang
natscat
2018-08-30 09:15:00 +08:00
@loqixh #12 现在滴滴头条好多 golang 了吧 不说七牛这种公司 golang 在国内真的挺热的(此处不讨论这语言咋样)
loqixh
2018-08-30 09:29:48 +08:00
@artandlol 能拿出手的就一个 docker 功能都是 linux 系统实现的, go 只当了个粘合层, docker 啥语言都能写, 只是凑巧用了 go 而已...按你这方法 ruby 肯定是比 go 主流得多的后端语言 一个 gitlab 不知道把 go 秒到哪里去了
loqixh
2018-08-30 09:31:35 +08:00
@natscat 然而除了你说的这几家其它就没有了, 而且这几家也只是系统少部分用了 go
encro
2018-08-30 09:36:48 +08:00
改不如不改。有多丑啊这是。
natscat
2018-08-30 09:47:09 +08:00
@loqixh #17 https://studygolang.com/topics/3685 当然不可能和 C++ Java 那样 毕竟 C++ Java 都好长时间了 golang 用的公司真的不少
natscat
2018-08-30 09:51:12 +08:00
TiDB 这个是 PingCAP 做的 是 go; codis 原来豌豆荚做的 也是 golang https://github.com/hackstoic/golang-open-source-projects

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/484373

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX