Я пытаюсь взглянуть на некоторые торговые данные, чтобы в основном проанализировать, какие торговые площадки оказывают пагубное влияние на торговлю P & L. Я использую Excel (из-за отсутствия лучшего варианта), и я имею дело с 1 млн. + Записей.

Чтобы дать вам представление о том, как выглядят данные, когда отправляется сделка, этот «родительский» ордер, скажем, 1 млн. Долл. США, разбивается на 10 меньших «дочерних» ордеров по 100 тыс. Фунтов стерлингов, которые затем отправляются на торговые площадки. Я хочу проанализировать, что происходит с ценой, которую мы получаем за последующие дочерние заказы, когда мы отправляем первого ребенка на конкретный обмен. Можно сделать вывод, что когда мы отправляем наш первый дочерний заказ на NYSE, последующие заказы получают плохие цены, как правило, более нескольких сотен тысяч родительских заказов.

Таким образом, упрощенные данные выглядят примерно так:

parent order    child order    venue       price vs benchmark(bps)
1               1              NYSE        0
1               2              LSE         -0.8
2               3              Deutsche    0.3
2               4              BATS        0
2               5              NYSE        -1.02
.               .              .           .
.               .              .           .
.               .              .           .

Как я могу сгруппировать данные по родителям, а затем углубиться в это, чтобы проанализировать для всех случаев, когда первый ордер поступает, например, на NYSE, что происходит с ценой по сравнению с эталоном для последующих потомков этого же родительского ордера.

0