Перейти к основному содержимому
Перейти к основному содержимому

Типы столбцов в собственном протоколе

См. Типы данных для общего ознакомления.

Совет

Кодирование числовых типов соответствует представлению данных в памяти процессоров с порядком байтов little-endian, таких как AMD64 или ARM64, что обеспечивает очень эффективное кодирование и декодирование.

ТипКодирование
Целые числа (Int/UInt)8, 16, 32, 64, 128 или 256 бит в формате little-endian
Числа с плавающей точкой (Float32/Float64)Двоичное представление IEEE 754
StringМассив строк в виде (len, value)
FixedString(N)Массив N-байтовых последовательностей
IPv4Псевдоним для UInt32, представляется как UInt32
IPv6Псевдоним для FixedString(16), представляется в двоичном виде
TupleМассив столбцов, закодированных подряд. Пример: Tuple(String, UInt8) = два последовательных столбца
MapMap(K, V) = три столбца: Offsets ColUInt64, Keys K, Values V. Число строк в Keys/Values = последнее значение Offsets
ArrayArray(T) = два столбца: Offsets ColUInt64, Data T. Число строк в Data = последнее значение Offsets
NullableNullable(T) = два столбца: Nulls ColUInt8, Values T с одинаковым числом строк. Nulls — это маска: 1=null, 0=value
UUIDПсевдоним для FixedString(16), представляется в двоичном виде
EnumПсевдоним для Int8 или Int16, каждому целому числу сопоставляется значение String
LowCardinalityLowCardinality(T) = два столбца: Index T, Keys K, где K — UInt8/16/32/64. Index содержит уникальные значения, Keys содержит индексы в Index
BoolПсевдоним для UInt8: 0=false, 1=true

Пример: кодирование Nullable

To encode [null, "", "hello", null, "world"]:
  Values: ["", "", "hello", "", "world"] (len: 5)
  Nulls:  [ 1,  0,       0,  1,       0] (len: 5)

Пример: кодировка LowCardinality

To encode ["Eko", "Eko", "Amadela", "Amadela", "Amadela", "Amadela"]:
  Index: ["Eko", "Amadela"] (String)
  Keys:  [0, 0, 1, 1, 1, 1] (UInt8)