Руководство по Cassandra. Работа с данными.

В данной статье мы рассмотрим работу с данными (основные CRUD операции) в Apache Cassandra.

Вставка данных

В прошлой статье мы удалили нашу таблицу, поэтому начнём с создания новой.

Для этого выполним команду:

CREATE TABLE developers (developer_id int PRIMARY KEY, first_name text, last_name text, specialty text, salary varint);

Проверяем:
DESCRIBE TABLES ;

В результате видим в консоли следующее:
cqlsh:proselyte> DESCRIBE TABLES ;

developers

Для создания записи используется команда следующего вида:

INSERT INTO <ИМЯ_ТАБЛИЦЫ> (<ИМЯ_КОЛОНКИ_1>, <ИМЯ_КОЛОНКИ_1>....) VALUES (<ЗНАЧЕНИЕ_1>, <ЗНАЧЕНИЕ_1>....) USING <ОПЦИИ>

Рассмотрим такой пример. Выполним поочередно следующие команды:
INSERT INTO developers (developer_id , first_name , last_name , salary , specialty ) VALUES ( 1, 'Eugene', 'Suleimanov', 5000, 'Software Engineer/Tech Lead') ;

INSERT INTO developers (developer_id , first_name , last_name , salary , specialty ) VALUES ( 2, 'Ivan', 'Ivanov', 4000, 'Software Engineer') ;

INSERT INTO developers (developer_id , first_name , last_name , salary , specialty ) VALUES ( 3, 'Sergey', 'Sergeev', 3000, 'QA') ;

Чтение данных
После записи данных мы можем проверить содержимое нашей таблицы.
Для чтения данных используется команда следующего вида:

SELECT * FROM <ИМЯ_ТАБЛИЦЫ>
Проверим, какие данные хранятся в таблице developers:
SELECT * FROM developers ;

В результате мы получим следующий вывод в консоль:
cqlsh:proselyte> SELECT * FROM developers ;

(3 rows)

Кроме того, мы можем ограничить колонки, которые будут отображены в результате выполнения запроса.
Общий вид команды:
SELECT <ИМЯ_КОЛОНКИ_1>, <ИМЯ_КОЛОНКИ_2>, <ИМЯ_КОЛОНКИ_3> FROM <ИМЯ_ТАБЛИЦЫ>

Попробуем выполнить следующую команду:
SELECT first_name, last_name, specialty FROM developers ;

Результатом выполнения данной команды будет следующий вывод в консоль:
cqlsh:proselyte> SELECT first_name, last_name, specialty FROM developers ;

(3 rows)

Также, мы имеем возможность задавать условия поиска.
Общий вид команды:
SELECT FROM

WHERE <УСЛОВИЕ>;

Например:
SELECT * FROM developers WHERE developer_id = 1 ;

(1 rows)

Важный момент, если мы попытаемся выполнить команду:
SELECT * FROM developers WHERE salary > 3500 ;

Мы получим ошибку:
InvalidRequest: Error from server: code=2200 [Invalid query] message="Cannot execute this query as it might involve data filtering and thus may have unpredictable performance. If you want to execute this query despite the performance unpredictability, use ALLOW FILTERING"

Т.е. Cassandra говорит, что поиск не по ключу – может ухудшить производительность. Если мы хотим выполнить подобный запрос, на основании колонки, которая не является ключом, то команда должна быть следующей:

SELECT * FROM developers WHERE salary > 3500 ALLOW FILTERING ;

Результат выполнения запроса:
cqlsh:proselyte> SELECT * FROM developers WHERE salary > 3500 ALLOW FILTERING ;

(2 rows)

Изменение данных
Для изменения данных используется команда следующего вида:
UPDATE <ИМЯ_ТАБЛИЦЫ> SET <ИМЯ_КОЛОНКИ> = <ЗНАЧЕНИЕ> <ИМЯ_КОЛОНКИ> = <ЗНАЧЕНИЕ>.... WHERE <УСЛОВИЕ>

Рассмотрим пример на нашей таблице developers. “Повысим” зарплату разработчику с id 3 с 3000 до 3500.

Смотрим текущие данные:
SELECT * FROM developers WHERE developer_id = 3;

(1 rows)

Изменяем данные:
UPDATE developers SET salary = 3500 WHERE developer_id = 3 ;

Проверяем:
Смотрим текущие данные:
SELECT * FROM developers WHERE developer_id = 3;

Результат:
cqlsh:proselyte> SELECT * FROM developers WHERE developer_id = 3;

(1 rows)

Удаление данных
Для удаления записи (записей) из таблицы используется команды следующего вида:
DELETE FROM <ИМЯ_ТАБЛИЦЫ> WHERE <УСЛОВИЕ>;

Попробуем удалить разработчика с developer_id 2. Проверяем таблицу:
cqlsh:proselyte> SELECT * FROM developers ;

(3 rows)

Удаляем данные:
DELETE FROM developers WHERE developer_id = 2;

И снова проверяем таблицу:
cqlsh:proselyte> SELECT * FROM developers ;

(2 rows)

Как видите, данные о разработчике с developer_id = 2 исчезли из таблицы.

Обработка пакетов данных
В Cassandra также предусмотрена пакетная обработка запросов. Т.е. мы можем выполнить несколько запросов “одновременно”.

Общий вид данной команды следующий:
BEGIN BATCH <ЗАПИСЬ> ... <ИЗМЕНЕНИЕ> <ИЗМЕНЕНИЕ> ... <ЗАПИСЬ> <УДАЛЕНИЕ> APPLY BATCH

На данный момент наша таблица имеет следующий вид:
cqlsh:proselyte> SELECT * FROM developers ;

(2 rows)

Рассмотрим следующий пример:
BEGIN BATCH INSERT INTO developers (developer_id , first_name , last_name , salary , specialty ) VALUES ( 4, 'Kirill', 'Kirilov', 3300, 'Software Engineer'); UPDATE developers SET salary = 6000 WHERE developer_id = 1; DELETE FROM developers WHERE developer_id = 3; APPLY BATCH ;

(2 rows)

Как мы можем видеть, все указанные изменения были выполнены

Полная очистка таблицы
И рассмотрим полную очистку таблицы. Общий вид команды:
TRUNCATE <ИМЯ_ТАБЛИЦЫ>

(2 rows)

Выполняем команду:
TRUNCATE developers ;

И выполняем запрос:
SELECT * FROM developers ;

Результат:
cqlsh:proselyte> SELECT * FROM developers ;

developer_id | first_name | last_name | salary | specialty
————–+————+———–+——–+———–

(0 rows)

На этом мы заканчиваем обзор работы с таблицами в Apache Cassanrda. В следующей статье мы рассмотрим типы данных в данной БД.

PROSELYTE

Software Engineering

Руководство по Cassandra. Работа с данными.

Поделиться