net.snowflake.ingest.streaming.internal.ParquetRowBuffer Maven / Gradle / Ivy

Go to download
Show more of this group Show more artifacts with this name
Show all versions of snowflake-ingest-sdk Show documentation
Snowflake Ingest SDK
The newest version!
/*
 * Copyright (c) 2022-2024 Snowflake Computing Inc. All rights reserved.
 */

package net.snowflake.ingest.streaming.internal;

import static net.snowflake.ingest.utils.Utils.concatDotPath;

import java.math.BigDecimal;
import java.math.BigInteger;
import java.nio.charset.StandardCharsets;
import java.time.ZoneId;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Objects;
import java.util.Optional;
import java.util.Set;
import java.util.function.Consumer;
import net.snowflake.client.jdbc.internal.google.common.collect.Sets;
import net.snowflake.ingest.connection.RequestBuilder;
import net.snowflake.ingest.connection.TelemetryService;
import net.snowflake.ingest.streaming.InsertValidationResponse;
import net.snowflake.ingest.streaming.OffsetTokenVerificationFunction;
import net.snowflake.ingest.streaming.OpenChannelRequest;
import net.snowflake.ingest.utils.Constants;
import net.snowflake.ingest.utils.ErrorCode;
import net.snowflake.ingest.utils.IcebergDataTypeParser;
import net.snowflake.ingest.utils.SFException;
import net.snowflake.ingest.utils.SubColumnFinder;
import org.apache.parquet.column.ColumnDescriptor;
import org.apache.parquet.column.ParquetProperties;
import org.apache.parquet.schema.MessageType;
import org.apache.parquet.schema.PrimitiveType;
import org.apache.parquet.schema.Type;

/**
 * The buffer in the Streaming Ingest channel that holds the un-flushed rows, these rows will be
 * converted to Parquet format for faster processing
 */
public class ParquetRowBuffer extends AbstractRowBuffer {

  /* map that contains metadata like typeinfo for columns and other information needed by the server scanner */
  private final Map metadata;

  /* Unflushed rows as Java objects. Needed for the Parquet w/o memory optimization. */
  private final List> data;
  private final List> tempData;

  private final ParquetProperties.WriterVersion parquetWriterVersion;

  private MessageType schema;
  private SubColumnFinder subColumnFinder;

  /** Construct a ParquetRowBuffer object. */
  ParquetRowBuffer(
      OpenChannelRequest.OnErrorOption onErrorOption,
      ZoneId defaultTimezone,
      String fullyQualifiedChannelName,
      Consumer rowSizeMetric,
      ChannelRuntimeState channelRuntimeState,
      ClientBufferParameters clientBufferParameters,
      OffsetTokenVerificationFunction offsetTokenVerificationFunction,
      ParquetProperties.WriterVersion parquetWriterVersion,
      TelemetryService telemetryService) {
    super(
        onErrorOption,
        defaultTimezone,
        fullyQualifiedChannelName,
        rowSizeMetric,
        channelRuntimeState,
        clientBufferParameters,
        offsetTokenVerificationFunction,
        telemetryService);
    this.metadata = new HashMap<>();
    this.data = new ArrayList<>();
    this.tempData = new ArrayList<>();
    this.parquetWriterVersion = parquetWriterVersion;
  }

  /**
   * Set up the parquet schema.
   *
   * @param columns top level columns list of column metadata
   */
  @Override
  public void setupSchema(List columns) {
    fieldIndex.clear();
    metadata.clear();
    if (!clientBufferParameters.isEnableIcebergStreaming()) {
      metadata.put("sfVer", "1,1");
    }
    metadata.put(Constants.SDK_VERSION_KEY, RequestBuilder.DEFAULT_VERSION);
    List parquetTypes = new ArrayList<>();
    int id = 1;

    for (ColumnMetadata column : columns) {
      /* Set up fields using top level column information */
      validateColumnCollation(column);
      ParquetTypeInfo typeInfo = ParquetTypeGenerator.generateColumnParquetTypeInfo(column, id);
      Type parquetType = typeInfo.getParquetType();
      parquetTypes.add(parquetType);
      this.metadata.putAll(typeInfo.getMetadata());
      int columnIndex = parquetTypes.size() - 1;
      fieldIndex.put(column.getInternalName(), new ParquetColumn(column, columnIndex, parquetType));

      if (!column.getNullable()) {
        addNonNullableFieldName(column.getInternalName());
      }

      if (!clientBufferParameters.isEnableIcebergStreaming()) {
        /* Streaming to FDN table doesn't support sub-columns, set up the stats here. */
        this.statsMap.put(
            column.getInternalName(),
            new RowBufferStats(
                column.getName(),
                column.getCollation(),
                column.getOrdinal(),
                null /* fieldId */,
                parquetType.isPrimitive() ? parquetType.asPrimitiveType() : null,
                false /* enableDistinctValuesCount */,
                false /* enableValuesCount */));

        if (onErrorOption == OpenChannelRequest.OnErrorOption.ABORT
            || onErrorOption == OpenChannelRequest.OnErrorOption.SKIP_BATCH) {
          /*
           * tempStatsMap is used to store stats for the current batch,
           * create a separate stats in case current batch has invalid rows which ruins the original stats.
           */
          this.tempStatsMap.put(
              column.getInternalName(),
              new RowBufferStats(
                  column.getName(),
                  column.getCollation(),
                  column.getOrdinal(),
                  null /* fieldId */,
                  parquetType.isPrimitive() ? parquetType.asPrimitiveType() : null,
                  false /* enableDistinctValuesCount */,
                  false /* enableValuesCount */));
        }
      }

      id++;
    }
    schema = new MessageType(clientBufferParameters.getParquetMessageTypeName(), parquetTypes);

    /*
     * Iceberg mode requires stats for all primitive columns and sub-columns, set them up here.
     *
     * There are two values that are used to identify a column in the stats map:
     *   1. ordinal - The ordinal is the index of the top level column in the schema.
     *   2. fieldId - The fieldId is the id of all sub-columns in the schema.
     *                It's indexed by the level and order of the column in the schema.
     *                Note that the fieldId is set to 0 for non-structured columns.
     *
     * For example, consider the following schema:
     *   F1 INT,
     *   F2 STRUCT(F21 STRUCT(F211 INT), F22 INT),
     *   F3 INT,
     *   F4 MAP(INT, MAP(INT, INT)),
     *   F5 INT,
     *   F6 ARRAY(INT),
     *   F7 INT
     *
     * The ordinal and fieldId  will look like this:
     *   F1:             ordinal=1, fieldId=1
     *   F2:             ordinal=2, fieldId=2
     *   F2.F21:         ordinal=2, fieldId=8
     *   F2.F21.F211:    ordinal=2, fieldId=13
     *   F2.F22:         ordinal=2, fieldId=9
     *   F3:             ordinal=3, fieldId=3
     *   F4:             ordinal=4, fieldId=4
     *   F4.key:         ordinal=4, fieldId=10
     *   F4.value:       ordinal=4, fieldId=11
     *   F4.value.key:   ordinal=4, fieldId=14
     *   F4.value.value: ordinal=4, fieldId=15
     *   F5:             ordinal=5, fieldId=5
     *   F6:             ordinal=6, fieldId=6
     *   F6.element:     ordinal=6, fieldId=12
     *   F7:             ordinal=7, fieldId=7
     *
     * The stats map will contain the following entries:
     *   F1:             ordinal=1, fieldId=0
     *   F2:             ordinal=2, fieldId=0
     *   F2.F21.F211:    ordinal=2, fieldId=13
     *   F2.F22:         ordinal=2, fieldId=9
     *   F3:             ordinal=3, fieldId=0
     *   F4.key:         ordinal=4, fieldId=10
     *   F4.value.key:   ordinal=4, fieldId=14
     *   F4.value.value: ordinal=4, fieldId=15
     *   F5:             ordinal=5, fieldId=0
     *   F6.element:     ordinal=6, fieldId=12
     *   F7:             ordinal=7, fieldId=0
     */
    if (clientBufferParameters.isEnableIcebergStreaming()) {
      for (ColumnDescriptor columnDescriptor : schema.getColumns()) {
        String[] path = columnDescriptor.getPath();
        String columnDotPath = concatDotPath(path);
        PrimitiveType primitiveType = columnDescriptor.getPrimitiveType();
        boolean isInRepeatedGroup = false;

        if (path.length > 1
            && schema
                .getType(Arrays.copyOf(path, path.length - 1))
                .isRepetition(Type.Repetition.REPEATED)) {
          if (!primitiveType.getName().equals(IcebergDataTypeParser.ELEMENT)
              && !primitiveType.getName().equals(IcebergDataTypeParser.KEY)
              && !primitiveType.getName().equals(IcebergDataTypeParser.VALUE)) {
            throw new SFException(
                ErrorCode.INTERNAL_ERROR,
                String.format(
                    "Invalid repeated column %s, column name must be %s, %s or %s",
                    columnDotPath,
                    IcebergDataTypeParser.ELEMENT,
                    IcebergDataTypeParser.KEY,
                    IcebergDataTypeParser.VALUE));
          }
          isInRepeatedGroup = true;
        }

        boolean isPrimitiveColumn = path.length == 1;

        /* set fieldId to 0 for non-structured columns */
        int fieldId = isPrimitiveColumn ? 0 : primitiveType.getId().intValue();
        int ordinal = schema.getType(columnDescriptor.getPath()[0]).getId().intValue();

        /**
         * For non-structured columns, server side performs EP metadata check by columnsDisplayName,
         * set it to the original column name to avoid EP validation error. Structured datatype is
         * checked by fieldId and ordinal where columnDisplayName doesn't matter.
         */
        String columnDisplayName =
            isPrimitiveColumn ? columns.get(ordinal - 1).getName() : columnDotPath;

        this.statsMap.put(
            primitiveType.getId().toString(),
            new RowBufferStats(
                columnDisplayName,
                null /* collationDefinitionString */,
                ordinal,
                fieldId,
                primitiveType,
                clientBufferParameters.isEnableDistinctValuesCount(),
                clientBufferParameters.isEnableValuesCount() && isInRepeatedGroup));

        if (onErrorOption == OpenChannelRequest.OnErrorOption.ABORT
            || onErrorOption == OpenChannelRequest.OnErrorOption.SKIP_BATCH) {
          this.tempStatsMap.put(
              primitiveType.getId().toString(),
              new RowBufferStats(
                  columnDisplayName,
                  null /* collationDefinitionString */,
                  ordinal,
                  fieldId,
                  primitiveType,
                  clientBufferParameters.isEnableDistinctValuesCount(),
                  clientBufferParameters.isEnableValuesCount() && isInRepeatedGroup));
        }
      }
      subColumnFinder = new SubColumnFinder(schema);
    }
    tempData.clear();
    data.clear();
  }

  @Override
  boolean hasColumn(String name) {
    return fieldIndex.containsKey(name);
  }

  @Override
  float addRow(
      Map row,
      int bufferedRowIndex,
      Map statsMap,
      Set formattedInputColumnNames,
      final long insertRowIndex,
      InsertValidationResponse.InsertError error) {
    return addRow(row, this::writeRow, statsMap, formattedInputColumnNames, insertRowIndex, error);
  }

  void writeRow(List