Golang 空结构体 (struct{}) 详解

空结构体 struct{} 是 Go 语言中一种特殊的结构体类型，它不包含任何字段。它的独特之处在于，它的大小为 零字节 (zero size)。这一特性使得空结构体在 Go 语言中具有多种巧妙的应用，尤其是在涉及内存优化和并发编程的场景中。

核心思想：空结构体 struct{} 的零字节大小特性，使其成为表达“存在即意义”或“信号”的最佳选择，它不占用额外内存，避免了不必要的资源开销。

一、空结构体的定义与特性

1.1 定义

一个空结构体是指不包含任何字段的结构体类型：

1	type Empty struct{}

或者直接作为匿名类型使用：

1	var e struct{}

1.2 零字节大小

这是空结构体的最核心特性。在 Go 语言中，struct{} 类型的值在内存中不占用任何空间。你可以通过 unsafe.Sizeof 函数来验证这一点：

package main

import (
	"fmt"
	"unsafe"
)

func main() {
	var e struct{}
	fmt.Printf("Size of struct{}: %d bytes\n", unsafe.Sizeof(e)) // Output: Size of struct{}: 0 bytes
}

为什么是零字节？

这是 Go 编译器的一个优化。由于空结构体没有字段，它不需要存储任何数据。因此，编译器可以安全地将其大小优化为零。

然而，需要注意的是：
尽管一个 struct{} 值本身不占用内存，但如果它被作为另一个结构体的最后一个字段，并且这个结构体不为空，那么为了确保内存对齐（特别是如果后面还有其他变量），编译器可能会为其分配一个填充字节。这通常被称为“final field padding”或“alignment padding”。但这只是在特定上下文中的对齐行为，空结构体本身的“值”仍然是零字节。

package main

import (
	"fmt"
	"unsafe"
)

type S1 struct {
	A int32
	B struct{} // B作为最后一个字段，通常不占用额外空间
}

type S2 struct {
	B struct{} // B作为第一个字段，通常不占用额外空间
	A int32
}

type S3 struct {
	A int32
	B struct{}
	C int32 // C在B之后，B可能会引起对齐填充
}

func main() {
	fmt.Printf("Size of int32: %d bytes\n", unsafe.Sizeof(int32(0))) // 4 bytes

	var s1 S1
	// S1: A (4 bytes) + B (0 bytes) = 4 bytes
	fmt.Printf("Size of S1: %d bytes\n", unsafe.Sizeof(s1)) // Output: 4 bytes

	var s2 S2
	// S2: B (0 bytes) + A (4 bytes) = 4 bytes
	fmt.Printf("Size of S2: %d bytes\n", unsafe.Sizeof(s2)) // Output: 4 bytes

	var s3 S3
	// S3: A (4 bytes) + B (0 bytes, 但可能需要填充4字节以对齐C) + C (4 bytes) = 8 bytes (或更多，取决于具体对齐策略)
	// 在64位系统上，通常int32是4字节对齐，所以B在这里不占用额外空间，整体大小为8字节
	fmt.Printf("Size of S3: %d bytes\n", unsafe.Sizeof(s3)) // Output: 8 bytes
}

注意：上述 S3 的例子中，unsafe.Sizeof(s3) 结果为 8 字节是因为 A 占 4 字节，C 占 4 字节，而 B 不占空间。如果 B 是 bool 类型（1字节），则 S3 可能为 12 字节 (4 + 1 + 3(padding) + 4)。但对于 struct{}，其零大小的特性使得它通常不会直接导致额外的填充，除非它位于其他需要特定对齐的字段之间。Go 编译器会尽可能优化内存布局。

1.3 可比较性

空结构体是可比较的，但由于它们没有任何字段，所有的空结构体值都是相等的。

1
2
3

var e1 struct{}
var e2 struct{}
fmt.Println(e1 == e2) // Output: true

二、空结构体的应用场景

空结构体的零字节大小特性使其在多种场景下都非常有用。

2.1 作为集合 (Set) 的值类型

在 Go 语言中，没有内置的 Set 数据结构。通常，我们使用 map[KeyType]struct{} 来模拟一个集合。通过将空结构体作为 map 的值类型，我们只关心 map 的键 (Key)，而不关心值，同时避免了不必要的内存分配，因为 struct{} 不占用内存。

package main

import "fmt"

func main() {
	// 模拟一个字符串集合
	set := make(map[string]struct{})

	// 添加元素
	set["apple"] = struct{}{}
	set["banana"] = struct{}{}
	set["orange"] = struct{}{}
	set["apple"] = struct{}{} // 重复添加没有影响

	// 检查元素是否存在
	if _, found := set["banana"]; found {
		fmt.Println("banana is in the set")
	}

	if _, found := set["grape"]; !found {
		fmt.Println("grape is NOT in the set")
	}

	// 遍历集合 (只遍历键)
	fmt.Println("Set elements:")
	for item := range set {
		fmt.Println(item)
	}

	// 删除元素
	delete(set, "orange")
	fmt.Println("After deleting orange:")
	for item := range set {
		fmt.Println(item)
	}
}

优点：相比于使用 map[string]bool (需要一个字节来存储布尔值) 或 map[string]int (需要四个或八个字节来存储整数)，使用 map[string]struct{} 可以最大限度地节省内存，特别是在集合中元素数量庞大时。

2.2 作为 Channel 的信号 (Signal)

在并发编程中，我们经常需要使用 Channel 来发送信号，而不是传递实际的数据。例如，通知一个 Goroutine 停止、任务完成、或者等待某个事件发生。在这种情况下，空结构体是传递信号的最佳选择，因为它不占用 Channel 缓冲区或 Goroutine 栈的内存，只起到触发事件的作用。

package main

import (
	"fmt"
	"time"
)

func worker(done chan struct{}) {
	fmt.Println("Worker started...")
	// 模拟工作
	time.Sleep(2 * time.Second)
	fmt.Println("Worker finished work.")
	// 通过向 done channel 发送一个空结构体，通知主 Goroutine 工作完成
	done <- struct{}{}
}

func main() {
	done := make(chan struct{}) // 创建一个用于发送信号的 Channel
	go worker(done)

	fmt.Println("Main Goroutine waiting for worker...")
	<-done // 阻塞等待 worker 发送完成信号
	fmt.Println("Main Goroutine received done signal. Exiting.")
}

优点：

内存效率：done <- struct{}{} 不会分配内存。
语义清晰：明确表示 Channel 仅用于同步和信号，而非数据传输。
避免死锁风险：如果使用带缓冲的 chan bool，当缓冲满时，发送方会阻塞。而 chan struct{} 即使有缓冲，其零大小的特性也使其在概念上更适合“无内容”的信号。

2.3 作为接口的实现者 (Interface Implementor)

在某些设计模式中，我们可能需要一个类型来满足某个接口，但这个类型本身并不需要存储任何状态或数据。空结构体可以作为这样的“标记”类型。

package main

import "fmt"

// 定义一个行为接口
type Logger interface {
	Log(msg string)
}

// 空结构体实现 Logger 接口
type ConsoleLogger struct{}

func (ConsoleLogger) Log(msg string) {
	fmt.Println("Log:", msg)
}

// 另一个空结构体实现 Logger 接口，用于测试或 mock
type NoOpLogger struct{}

func (NoOpLogger) Log(msg string) {
	// 什么都不做
}

func main() {
	var logger Logger

	logger = ConsoleLogger{}
	logger.Log("Hello from ConsoleLogger!")

	logger = NoOpLogger{}
	logger.Log("This message will not be printed.") // 调用 NoOpLogger 的 Log 方法

	fmt.Printf("Type of ConsoleLogger: %T\n", ConsoleLogger{}) // main.ConsoleLogger
	fmt.Printf("Type of NoOpLogger: %T\n", NoOpLogger{})       // main.NoOpLogger
}

优点：

简洁：如果接口方法不需要访问实例的状态，使用空结构体作为接收者是最简洁的方式。
内存优化：即使创建了多个 ConsoleLogger{} 实例，它们也不占用内存（除非被分配到堆上并且需要指针）。

2.4 作为只读信号量 (Semaphore)

在需要限制并发或实现互斥但不传递数据的场景中，空结构体可以作为信号量的令牌。

package main

import (
	"fmt"
	"runtime"
	"sync"
	"time"
)

func main() {
	// 创建一个容量为 N 的缓冲 channel 作为信号量
	// 限制最多 N 个 Goroutine 同时执行某个操作
	concurrencyLimit := 3
	semaphore := make(chan struct{}, concurrencyLimit)
	var wg sync.WaitGroup

	for i := 0; i < 10; i++ {
		wg.Add(1)
		go func(id int) {
			defer wg.Done()

			semaphore <- struct{}{} // 获取令牌，如果 channel 满则阻塞
			fmt.Printf("Goroutine %d acquired semaphore. Current goroutines: %d\n", id, runtime.NumGoroutine())

			time.Sleep(500 * time.Millisecond) // 模拟工作

			fmt.Printf("Goroutine %d released semaphore.\n", id)
			<-semaphore // 释放令牌
		}(i)
	}

	wg.Wait()
	fmt.Println("All goroutines finished.")
}