Аргументы против того, чтобы всегда использовать функции Serverless

Бессерверные функции — это новая блестящая игрушка, с которой все хотят поиграть. Они обещают бесконечную масштабируемость, отсутствие управления инфраструктурой и волшебную модель ценообразования «плати только за то, что используешь». Но вот в чём дело: возможность поместить всё в бессерверную функцию не означает, что так и нужно делать.

Позвольте мне быть тем, кто испортит вам веселье и расскажет, почему ваш подход «сначала бессерверные функции» может стоить вам не только денег, но и здравомыслия, производительности и контроля над вашим собственным приложением.

Холодный, суровый факт о холодных запусках

Представьте себе: ваш пользователь нажимает кнопку, ожидая мгновенного ответа, но вместо этого он смотрит на индикатор загрузки, пока AWS Lambda решает проснуться от своего сладкого сна. Добро пожаловать в мир холодных запусков — бессерверного эквивалента попытки завести машину зимним утром в Миннесоте.

Холодные запуски происходят, когда бессерверная функция не использовалась в последнее время, и облачному провайдеру необходимо создать новые ресурсы для обработки вашего запроса. Это не просто незначительное неудобство; это штраф за производительность, который может варьироваться от сотен миллисекунд до нескольких секунд, в зависимости от вашего времени выполнения и размера функции.

Вот простой пример того, как это влияет на реальные приложения:

// Эта безобидная на вид функция может занять 2–3 секунды при холодном запуске
exports.handler = async (event) => {
    const heavyLibrary = require('some-massive-library');
    const database = await connectToDatabase();
    // Ваша фактическая бизнес-логика (занимает 50 мс)
    const result = await processUserRequest(event);
    return {
        statusCode: 200,
        body: JSON.stringify(result)
    };
};

Ирония судьбы? Чем легче ваш трафик, тем больше холодных запусков вы испытаете. Это как наказание за недостаточную популярность.

sequenceDiagram participant Пользователь participant API Gateway participant Lambda participant База данных Пользователь->>API Gateway: Запрос (первый раз за несколько часов) API Gateway->>Lambda: Вызов функции Note over Lambda: Холодный запуск — выделение ресурсов Note over Lambda: Загрузка среды выполнения и зависимостей Note over Lambda: Инициализация соединений Lambda->>База данных: Подключение (медленно) База данных-->>Lambda: Подключение установлено Lambda->>Lambda: Обработка запроса (быстро) Lambda-->>API Gateway: Ответ API Gateway-->>Пользователь: Ответ (через 3 секунды) Note over Пользователь: Пользователь уже ушёл с вашего сайта

Когда бессерверные функции становятся более дорогими

Давайте поговорим о главном: о стоимости. Модель «плати только за то, что используешь» звучит фантастически, пока вы не поймёте, что «то, что вы используете», включает в себя каждую миллисекунду, пока ваша функция думает, а не только работает.

Рассмотрим задание по обработке данных, которое должно обработать большие файлы:

import time
import boto3
def lambda_handler(event, context):
    # Это выполняется в течение 10 минут, обрабатывая большой набор данных
    s3 = boto3.client('s3')
    # Загрузка большого файла (2 минуты)
    large_file = s3.download_file('bucket', 'huge-dataset.csv')
    # Обработка данных (8 минут CPU-интенсивной работы)
    processed_data = crunch_numbers(large_file)
    # Загрузка результатов
    s3.upload_file(processed_data, 'bucket', 'results.json')
    return {'status': 'completed'}

Запуск этого на AWS Lambda с 1 ГБ памяти в течение 10 минут стоит около 0,10 доллара за выполнение. Звучит дёшево? Запустите это 1000 раз в месяц, и вы получите 100 долларов. Аналогичный инстанс EC2 (t3.medium) стоит около 30 долларов в месяц и может справиться с этой нагрузкой с запасом.

Математика становится ещё более удручающей, когда вы учитываете накладные расходы на разбиение монолитных процессов на более мелкие функции, каждая из которых имеет свои штрафы за холодные запуски и затраты на межсервисную коммуникацию.

Отладка: добро пожаловать в адскую кухню

Если вы когда-либо пытались отладить распределённую систему, отладка бессерверных приложений заставит вас с ностальгией вспоминать те более простые времена. Традиционные методы отладки рушатся, когда ваше приложение разбросано по десяткам эфемерных функций.

Вот как выглядит отладка в бессерверном мире:

// Функция A
exports.orderProcessor = async (event) => {
    try {
        const order = JSON.parse(event.body);
        // Это может завершиться неудачей, но удачи вам в её воспроизведении
        const validatedOrder = await validateOrder(order);
        // Запуск другой функции
        await triggerInventoryUpdate(validatedOrder);
        return { success: true };
    } catch (error) {
        // Этот журнал может быть в одной из 47 различных групп журналов CloudWatch
        console.error('Что-то сломалось:', error);
        throw error;
    }
};
// Функция B (запускается функцией A)
exports.inventoryUpdater = async (event) => {
    // К тому времени, когда вы поймёте, что это не удалось, исходный контекст давно потерян
    const order = event.detail;
    // Это подключение к базе данных может завершиться таймаутом непредсказуемо
    const inventory = await updateInventory(order.items);
    if (!inventory.success) {
        // Удачи вам связать эту ошибку с исходным запросом пользователя
        throw new Error('Ошибка обновления инвентаря');
    }
};

Когда что-то идёт не так (а это обязательно случится), вы будете играть в детектива, просматривая несколько потоков журналов, пытаясь собрать воедино распределённую головоломку, где половина деталей может отсутствовать из-за проблем с таймаутом функций или неудачных вызовов, которые не были должным образом зарегистрированы.

Ловушка привязки к поставщику

Выбор бессерверных функций часто означает выбор конкретной реализации бессерверных функций облачного провайдера. Функции AWS Lambda не работают магическим образом на Google Cloud Functions, и ни одна из них не работает без значительных изменений кода с Azure Functions.

Вот как выглядит код, специфичный для поставщика:

# Реализация специфичная для AWS
import boto3
from aws_lambda_powertools import Logger
logger = Logger()
def lambda_handler(event, context):
    # Структура события специфичная для AWS
    records = event.get('Records', [])
    # Сервисы специфичные для AWS
    dynamodb = boto3.resource('dynamodb')
    table = dynamodb.Table('UserData')
    for record in records:
        # Формат сообщения специфичный для AWS SQS
        message = json.loads(record['body'])
        logger.info("Обработка сообщения", extra={"message_id": record['messageId']})
        # Операции специфичные для DynamoDB AWS
        table.put_item(Item=message)

Попробуйте перенести это в Google Cloud, и вам придётся переписывать:

Обработку структуры событий;
Механизмы журналирования;
Подключения к базам данных;
Интеграции с очередями сообщений;
Инструменты мониторинга и наблюдаемости.

Это как строить свой дом на арендованной земле — удобно, пока не возникнет необходимость переезжать.

Кошмар человека, одержимого контролем

Помните те времена, когда вы могли подключиться по SSH к своему серверу и точно знать, что происходит? Бессерверные функции лишают вас этого контроля и заменяют его верой в вашего облачного провайдера.

Нужно установить пользовательскую системную библиотеку? Извините, не разрешено. Хотите настроить параметры JVM для повышения производительности? Нет. Нужно запустить фоновый процесс, который не соответствует модели запроса-ответа? Вам не повезло.

# Вещи, которые вы не можете делать в бессерверном режиме (но очень скучаете по ним):
# Установка пользовательских системных пакетов
sudo apt-get install custom-driver
# Тонкая настройка параметров времени выполнения
export JVM_OPTS="-Xmx4g -XX:+UseG1GC"
# Запуск фоновых процессов
nohup python data_sync_daemon.py &
# Мониторинг системных ресурсов в реальном времени
htop
# Отладка с помощью подходящих инструментов
gdb -p $(pgrep my_application)

Вместо этого вы получаете чёрный ящик, который иногда работает идеально, а иногда сбоит по загадочным причинам, на расследование которых служба поддержки потратит три дня.

Парадокс сложности

Бессерверные функции обещают упростить управление инфраструктурой, но часто переносят сложность с инфраструктуры на архитектуру. Вместо управления серверами вы теперь управляете:

Зависимостями и версиями функций;
Узорами межсервисной коммуникации;
Событиями, управляющими рабочими процессами;
Распределённым журналированием и мониторингом;
Сервисными сетками и API-шлюзами;
Оркестровкой функций и обработкой ошибок.

graph TD A[API Gateway] --> B[Функция аутен

Subscribe to Our Telegram Channel

Подпишитесь на наш телеграм

Thank you for subscribing!

Спасибо за подписку!

Холодный, суровый факт о холодных запусках#

Когда бессерверные функции становятся более дорогими#

Отладка: добро пожаловать в адскую кухню#

Ловушка привязки к поставщику#

Кошмар человека, одержимого контролем#

Парадокс сложности#