All Downloads are FREE. Search and download functionalities are using the official Maven repository.

com.siashan.toolkit.crypt.binary.BaseNCodec Maven / Gradle / Ivy

package com.siashan.toolkit.crypt.binary;

import com.siashan.toolkit.crypt.*;
import com.siashan.toolkit.crypt.util.StringUtils;

import java.util.Arrays;
import java.util.Objects;

/**
 * Base 算法抽象类
 *
 * @author siashan
 * @since v1.0.7
 */
public abstract class BaseNCodec implements BinaryEncoder, BinaryDecoder {

    /**
     * 保存线程上下文,因此类可以是线程安全的
     *
     * 这个类本身不是线程安全的;每个线程必须分配自己的副本.
     *
     * @since 1.0.7
     */
    static class Context {

        /**
         * 我们正在处理的基于逻辑的字节的占位符.
         * 按位操作存储并提取此变量的编码或解码.
         */
        int ibitWorkArea;

        /**
         * 我们正在处理的基于逻辑的字节的占位符.
         * 按位操作存储并提取此变量的编码或解码.
         */
        long lbitWorkArea;

        /**
         * 流媒体缓冲区.
         */
        byte[] buffer;

        /**
         * 应在缓冲区中写入下一个字符的位置.
         */
        int pos;

        /**
         * 从缓冲区读取下一个字符的位置.
         */
        int readPos;

        /**
         * 表示已达到EOF的布尔标志。一旦达到EOF,该对象将变得无用,必须扔掉
         */
        boolean eof;

        /**
         * 变量跟踪已写入当前行的字符数。仅在编码时使用。我们使用
         * 它可以确保每一个编码的行永远不会超过lineLength(如果lineLength>;0)
         */
        int currentLinePos;

        /**
         * 只有在编码时每读取3/5次,解码时每读取4/8次后,才会写入缓冲区。这变量有助于跟踪它。
         */
        int modulus;

        Context() {
        }

        /**
         * 返回对调试有用的字符串(特别是在调试器中)
         *
         * @return 用于调试的字符串。
         */
        @SuppressWarnings("boxing") // OK to ignore boxing here
        @Override
        public String toString() {
            return String.format("%s[buffer=%s, currentLinePos=%s, eof=%s, ibitWorkArea=%s, lbitWorkArea=%s, " +
                    "modulus=%s, pos=%s, readPos=%s]", this.getClass().getSimpleName(), Arrays.toString(buffer),
                    currentLinePos, eof, ibitWorkArea, lbitWorkArea, modulus, pos, readPos);
        }
    }

    /**
     * EOF
     *
     * @since 1.0.7
     */
    static final int EOF = -1;

    /**
     *  根据RFC 2045第6.8节的MIME块大小
     *
     * 

* {@value}字符限制不计算尾随的CRLF,但计算所有其他字符,包括任何字符等号。 *

* * @see RFC 2045 section 6.8 */ public static final int MIME_CHUNK_SIZE = 76; /** * 根据RFC 1421第4.3.2.4节,PEM块大小. * *

* {@value}字符限制不计算尾随的CRLF,但计算所有其他字符,包括任何等号 *

* * @see RFC 1421 section 4.3.2.4 */ public static final int PEM_CHUNK_SIZE = 64; private static final int DEFAULT_BUFFER_RESIZE_FACTOR = 2; /** * 定义默认缓冲区大小-当前为{@value} * -必须足够大,以容纳至少一个编码块+分隔符 */ private static final int DEFAULT_BUFFER_SIZE = 8192; /** * 要分配的最大缓冲区大小. * *

这与JDK{@code java.util.ArrayList}中使用的大小相同:

*
* 有些虚拟机在数组中保留一些头字。 * 尝试分配较大的阵列可能会导致 * OutOfMemoryError:请求的数组大小超过VM限制。 *
*/ private static final int MAX_BUFFER_SIZE = Integer.MAX_VALUE - 8; /** 用于提取8位的掩码,用于解码字节 */ protected static final int MASK_8BITS = 0xff; /** * 用于填充输出的字节. */ protected static final byte PAD_DEFAULT = '='; // Allow static access to default /** * 默认解码策略. */ protected static final CodecPolicy DECODING_POLICY_DEFAULT = CodecPolicy.LENIENT; /** * 符合RFC 2045第2.1节的区块分隔符. * * @see RFC 2045 section 2.1 */ static final byte[] CHUNK_SEPARATOR = {'\r', '\n'}; /** * 比较两个{@code int}值,并对这些值进行数值处理没有签名。摘自JDK1.8 * * * @param x 要比较的第一个{@code int} * @param y 要比较的第二个{@code int} * @return 如果{@code x==y},则值{@code 0};没有价值 * 如果{@code xy}为,则大于{@code 0}的值 * 无符号值 */ private static int compareUnsigned(final int x, final int y) { return Integer.compare(x + Integer.MIN_VALUE, y + Integer.MIN_VALUE); } /** * 创建至少与最小所需容量相同的正容量。 * 如果最小容量为负,则会抛出OutOfMemoryError,因为没有数组 * 可以分配. * * @param minCapacity 最小容量 * @return 容量 * @throws OutOfMemoryError 如果{@code minCapacity}为负 */ private static int createPositiveCapacity(final int minCapacity) { if (minCapacity < 0) { // overflow throw new OutOfMemoryError("Unable to allocate array size: " + (minCapacity & 0xffffffffL)); } // This is called when we require buffer expansion to a very big array. // Use the conservative maximum buffer size if possible, otherwise the biggest required. // // Note: In this situation JDK 1.8 java.util.ArrayList returns Integer.MAX_VALUE. // This excludes some VMs that can exceed MAX_BUFFER_SIZE but not allocate a full // Integer.MAX_VALUE length array. // The result is that we may have to allocate an array of this size more than once if // the capacity must be expanded again. return (minCapacity > MAX_BUFFER_SIZE) ? minCapacity : MAX_BUFFER_SIZE; } /** * 根据RFC 2045第2.1节获取块分隔符的副本. * * @return 块分隔符 * @see RFC 2045 section 2.1 * @since 1.0.7 */ public static byte[] getChunkSeparator() { return CHUNK_SEPARATOR.clone(); } /** * 检查字节值是否为空白. * 空格的意思是:空格、制表符、CR、LF * @param byteToCheck * 要检查的字节 * @return 如果字节为空白,则为true,否则为false */ protected static boolean isWhiteSpace(final byte byteToCheck) { switch (byteToCheck) { case ' ' : case '\n' : case '\r' : case '\t' : return true; default : return false; } } /** * 通过 {@link #DEFAULT_BUFFER_RESIZE_FACTOR} 增加缓冲区. * @param context 要使用的上下文 * @param minCapacity 所需的最小容量 * @return 调整大小的字节[]缓冲区 * @throws OutOfMemoryError 如果{@code minCapacity}为负 */ private static byte[] resizeBuffer(final Context context, final int minCapacity) { // Overflow-conscious code treats the min and new capacity as unsigned. final int oldCapacity = context.buffer.length; int newCapacity = oldCapacity * DEFAULT_BUFFER_RESIZE_FACTOR; if (compareUnsigned(newCapacity, minCapacity) < 0) { newCapacity = minCapacity; } if (compareUnsigned(newCapacity, MAX_BUFFER_SIZE) > 0) { newCapacity = createPositiveCapacity(minCapacity); } final byte[] b = new byte[newCapacity]; System.arraycopy(context.buffer, 0, b, 0, context.buffer.length); context.buffer = b; return b; } // 实例变量,以防以后需要更改 protected final byte pad; /** 每个完整的未编码数据块中的字节数,例如,Base64为4,Base32为5 */ private final int unencodedBlockSize; /** 每个完整编码数据块中的字节数,例如,Base64为3,Base32为8 */ private final int encodedBlockSize; /** * 用于编码的块大小。解码时不使用. * 值为零或更小意味着编码数据不分块. * 向下舍入到encodedBlockSize的最近倍数. */ protected final int lineLength; /** * 块分隔符的大小。除非{@link#lineLength}>;0. */ private final int chunkSeparatorLength; /** * 定义输入字节包含剩余尾随位时的解码行为 * 无法使用有效的编码创建。这些可以是从最终版本中未使用的位 * 字符或整个字符。默认模式是宽松解码。将此设置为 * {@code true}以启用严格解码。 *
    *
  • 宽松:在可能的情况下,任何尾随位都被组成8位字节。其余部分将被丢弃. *
  • 严格:解码将引发{@link IllegalArgumentException}如果尾随位 * 不是有效编码的一部分。最后一个字符中任何未使用的位必须 * 是零。不允许对整个最终字符进行不可能计数. *
* *

当启用严格解码时,预计解码的字节将被重新编码 * 与原始数组相匹配的字节数组,即最终数组没有变化 * 性格这要求输入字节使用相同的填充和字母表 * 作为编码器。 *

*/ private final CodecPolicy decodingPolicy; /** * 注{@code lineLength}向下舍入到编码块大小的最近倍数。 * 如果{@code chunkSeparatorLength}为零,则禁用分块。 * @param unencodedBlockSize 未编码块的大小(例如Base64=3) * @param encodedBlockSize 编码块的大小(例如Base64=4) * @param lineLength 如果>;0,使用长度为{@code lineLength}的分块 * @param chunkSeparatorLength 块分隔符长度(如果相关) */ protected BaseNCodec(final int unencodedBlockSize, final int encodedBlockSize, final int lineLength, final int chunkSeparatorLength) { this(unencodedBlockSize, encodedBlockSize, lineLength, chunkSeparatorLength, PAD_DEFAULT); } /** * 注{@code lineLength}向下舍入到编码块大小的最近倍数。 * 如果{@code chunkSeparatorLength}为零,则禁用分块。 * @param unencodedBlockSize 未编码块的大小(例如Base64=3) * @param encodedBlockSize 编码块的大小(例如Base64=4) * @param lineLength 如果>;0,使用长度为{@code lineLength}的分块 * @param chunkSeparatorLength 块分隔符长度(如果相关) * @param pad 用作填充字节的字节. */ protected BaseNCodec(final int unencodedBlockSize, final int encodedBlockSize, final int lineLength, final int chunkSeparatorLength, final byte pad) { this(unencodedBlockSize, encodedBlockSize, lineLength, chunkSeparatorLength, pad, DECODING_POLICY_DEFAULT); } /** * 注{@code lineLength}向下舍入到编码块大小的最近倍数。 * 如果{@code chunkSeparatorLength}为零,则禁用分块. * @param unencodedBlockSize 未编码块的大小(例如Base64=3) * @param encodedBlockSize 编码块的大小(例如Base64=4) * @param lineLength 如果>;0,使用长度为{@code lineLength}的分块 * @param chunkSeparatorLength 块分隔符长度(如果相关) * @param pad 用作填充字节的字节. * @param decodingPolicy 解码策略. * @since 1.0.7 */ protected BaseNCodec(final int unencodedBlockSize, final int encodedBlockSize, final int lineLength, final int chunkSeparatorLength, final byte pad, final CodecPolicy decodingPolicy) { this.unencodedBlockSize = unencodedBlockSize; this.encodedBlockSize = encodedBlockSize; final boolean useChunking = lineLength > 0 && chunkSeparatorLength > 0; this.lineLength = useChunking ? (lineLength / encodedBlockSize) * encodedBlockSize : 0; this.chunkSeparatorLength = chunkSeparatorLength; this.pad = pad; this.decodingPolicy = Objects.requireNonNull(decodingPolicy, "codecPolicy"); } /** * 返回可用于读取的缓冲数据量. * * @param context 要使用的上下文 * @return 可用于读取的缓冲数据量. */ int available(final Context context) { // package protected for access from I/O streams return context.buffer != null ? context.pos - context.readPos : 0; } /** * 测试给定的字节数组,查看它是否包含字母表或键盘中的任何字符. * * 用于检查行尾数组 * * @param arrayOctet * 要测试的字节数组 * @return {@code true}如果任何字节是字母表或键盘中的有效字符;{@code false}否则 */ protected boolean containsAlphabetOrPad(final byte[] arrayOctet) { if (arrayOctet == null) { return false; } for (final byte element : arrayOctet) { if (pad == element || isInAlphabet(element)) { return true; } } return false; } /** * 解码包含Base-N字母表中字符的字节[]. * * @param pArray * 一种包含基N字符数据的字节数组 * @return 包含二进制数据的字节数组 */ @Override public byte[] decode(final byte[] pArray) { if (pArray == null || pArray.length == 0) { return pArray; } final Context context = new Context(); decode(pArray, 0, pArray.length, context); decode(pArray, 0, EOF, context); // Notify decoder of EOF. final byte[] result = new byte[context.pos]; readResults(result, 0, result.length, context); return result; } // package protected for access from I/O streams abstract void decode(byte[] pArray, int i, int length, Context context); /** * 使用Base-N算法解码对象。提供此方法是为了满足 * 解码器接口,如果提供的对象不是byte[]或String类型,则将抛出DecoderException * * @param obj * 要解码的对象 * @return 一个对象(类型为byte[]),包含对应于byte[]或字符串的二进制数据提供. * @throws DecoderException * 如果提供的参数不是byte[]类型 */ @Override public Object decode(final Object obj) throws DecoderException { if (obj instanceof byte[]) { return decode((byte[]) obj); } else if (obj instanceof String) { return decode((String) obj); } else { throw new DecoderException("Parameter supplied to Base-N decode is not a byte[] or a String"); } } /** * 解码包含Base-N字母表中字符的字符串. * * @param pArray * 包含以N为基数的字符数据的字符串 * @return 包含二进制数据的字节数组 */ public byte[] decode(final String pArray) { return decode(StringUtils.getBytesUtf8(pArray)); } /** * 将包含二进制数据的字节[]编码为包含字母表中字符的字节[]. * * @param pArray * 包含二进制数据的字节数组 * @return 仅包含基N字母字符数据的字节数组 */ @Override public byte[] encode(final byte[] pArray) { if (pArray == null || pArray.length == 0) { return pArray; } return encode(pArray, 0, pArray.length); } /** * 将包含二进制数据的字节[]编码为包含二进制数据的字节[] * 字母表中的字符. * * @param pArray * 包含二进制数据的字节数组 * @param offset * 子阵列的初始偏移量。 * @param length * 子阵列的长度。 * @return 仅包含基N字母字符数据的字节数组 */ public byte[] encode(final byte[] pArray, final int offset, final int length) { if (pArray == null || pArray.length == 0) { return pArray; } final Context context = new Context(); encode(pArray, offset, length, context); encode(pArray, offset, EOF, context); // Notify encoder of EOF. final byte[] buf = new byte[context.pos - context.readPos]; readResults(buf, 0, buf.length, context); return buf; } // package protected for access from I/O streams abstract void encode(byte[] pArray, int i, int length, Context context); /** * 使用Base-N算法对对象进行编码。提供此方法是为了满足 * 编码器接口,如果提供的对象不是byte[]类型,则将抛出EncoderException. * * @param obj * 对象进行编码 * @return 一个对象(类型为byte[]),包含与提供的byte[]相对应的Base-N编码数据. * @throws EncoderException * 如果提供的参数不是byte[]类型 */ @Override public Object encode(final Object obj) throws EncoderException { if (!(obj instanceof byte[])) { throw new EncoderException("Parameter supplied to Base-N encode is not a byte[]"); } return encode((byte[]) obj); } /** * 将包含二进制数据的字节[]编码为包含相应字母表中字符的字符串. * UTF使用8编码. * * @param pArray 包含二进制数据的字节数组 * @return 仅包含相应字母表中的字符数据的字符串. */ public String encodeAsString(final byte[] pArray){ return StringUtils.newStringUtf8(encode(pArray)); } /** * 将包含二进制数据的字节[]编码为包含Base-N字母表中字符的字符串。 * 使用 UTF8 编码. * * @param pArray * 包含二进制数据的字节数组 * @return 仅包含基N字符数据的字符串 */ public String encodeToString(final byte[] pArray) { return StringUtils.newStringUtf8(encode(pArray)); } /** * 确保缓冲区有空间容纳{@code size}字节 * * @param size 所需的最小备用空间 * @param context 要使用的上下文 * @return 缓冲区 */ protected byte[] ensureBufferSize(final int size, final Context context){ if (context.buffer == null) { context.buffer = new byte[Math.max(size, getDefaultBufferSize())]; context.pos = 0; context.readPos = 0; // Overflow-conscious: // x + y > z == x + y - z > 0 } else if (context.pos + size - context.buffer.length > 0) { return resizeBuffer(context, context.pos + size); } return context.buffer; } /** * 返回解码行为策略. * *

* 默认为宽松。如果解码策略是严格的,则解码将引发错误 * {@link IllegalArgumentException}如果尾随位不是有效编码的一部分。解码将组成 * 将尾随位转换为8位字节,并丢弃剩余的字节. *

* * @return 如果使用严格解码,则为true */ public CodecPolicy getCodecPolicy() { return decodingPolicy; } /** * 获取默认缓冲区大小。可以覆盖. * * @return 默认缓冲区大小. */ protected int getDefaultBufferSize() { return DEFAULT_BUFFER_SIZE; } /** * 计算对提供的数组进行编码所需的空间量. * * @param pArray 字节[]数组,稍后将对其进行编码 * * @return 对提供的数组进行编码所需的空间量. */ public long getEncodedLength(final byte[] pArray) { // Calculate non-chunked size - rounded up to allow for padding // cast to long is needed to avoid possibility of overflow long len = ((pArray.length + unencodedBlockSize-1) / unencodedBlockSize) * (long) encodedBlockSize; if (lineLength > 0) { // We're using chunking // Round up to nearest multiple len += ((len + lineLength-1) / lineLength) * chunkSeparatorLength; } return len; } /** * 如果此对象具有用于读取的缓冲数据,则返回true. * * @param context 要使用的上下文 * @return 如果仍有数据可供读取,则为true. */ boolean hasData(final Context context) { // package protected for access from I/O streams return context.buffer != null; } /** * 返回{@code octet}是否在当前字母表中. * 不允许空白或填充. * * @param value 要测试的值 * * @return {@code true}如果值是在当前字母表中定义的,则{@code false}否则. */ protected abstract boolean isInAlphabet(byte value); /** * 测试给定的字节数组,看它是否只包含字母表中的有效字符. * 该方法选择性地将空格和pad视为有效. * * @param arrayOctet 要测试的字节数组 * @param allowWSPad 如果{@code true},则也允许使用空格和PAD * * @return {@code true}如果所有字节都是字母表中的有效字符,或者如果字节数组为空;否则为{@code false} */ public boolean isInAlphabet(final byte[] arrayOctet, final boolean allowWSPad) { for (final byte octet : arrayOctet) { if (!isInAlphabet(octet) && (!allowWSPad || (octet != pad) && !isWhiteSpace(octet))) { return false; } } return true; } /** * 测试给定字符串,查看其是否仅包含字母表中的有效字符. * 该方法将空格和PAD视为有效. * * @param basen 要测试的字符串 * @return {@code true}如果字符串中的所有字符都是字母表中的有效字符,或者 * 字符串为空;{@code false},否则为 * @see #isInAlphabet(byte[], boolean) */ public boolean isInAlphabet(final String basen) { return isInAlphabet(StringUtils.getBytesUtf8(basen), true); } /** * 如果解码行为严格,则返回true。如果出现拖尾,解码将引发{@link IllegalArgumentException} * 位不是有效编码的一部分. * *

* 对于宽松解码,默认值为false。解码将把尾随位合成8位字节,并丢弃余数 *

* * @return 如果使用严格解码,则为true */ public boolean isStrictDecoding() { return decodingPolicy == CodecPolicy.STRICT; } /** * 将缓冲数据提取到提供的byte[]数组中,从位置bPos开始,最大值为bAvail字节。返回实际提取的字节数。 *

* 受保护的包,可从I/O流访问. * * @param b * 字节[]数组,用于将缓冲数据提取到. * @param bPos * 在字节[]数组中开始提取的位置. * @param bAvail * 允许提取的字节数。我们可能提取较少的(如果可用较少). * @param context * 要使用的上下文 * @return 成功提取到提供的字节[]数组中的字节数. */ int readResults(final byte[] b, final int bPos, final int bAvail, final Context context) { if (context.buffer != null) { final int len = Math.min(available(context), bAvail); System.arraycopy(context.buffer, context.readPos, b, bPos, len); context.readPos += len; if (context.readPos >= context.pos) { context.buffer = null; // so hasData() will return false, and this method can return -1 } return len; } return context.eof ? EOF : 0; } }





© 2015 - 2024 Weber Informatics LLC | Privacy Policy